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Die CC-BY Fassung (2022) wurde möglich durch den vollständigen Rückfall aller 
Nutzungsrechte vom Olms Verlag an den Autor zum 1.9.2022. Sie unterscheidet sich 
von der Druckfassung (2017) nur durch kleinere unten angegebene Korrekturen und 
diese einleitenden Seiten. Ebenso wie in der originalen Dissertation (2016) erscheint nun 
auch wieder nur der kurze Haupttitel „Der Vokalläger”, dafür aber ein längerer Untertitel 
(„Eine phonetische...”); in der Fassung (2017) war abweichend der erste Teil des 
Untertitels dem Haupttitel zugefügt. Die originale Seitenzählung und der Textumbruch 


sind unverändert. 


Korrekturen: S.]14: Löschen der Zeile K60. S. 127: Setze KÖ1 anstatt KO7. S. 269, 412 und in dem Belegen: Rauhs 
Lautzeichen für vokalisiertes abschließendes -ER ist [ä] und nicht [ä], Rauh 1921. S. 270: Lautzeichen für silbisches N. S. 
363: Beleg Opf 1.1.147. 


Die phonetische Kemalgorithmik des Vokallägers (2017) ist als eigenständige R- 


Neuimplementierung im Internet auf 
http: / /vokaliaeger.or 


veröffentlicht. 


Die Belege zum Frankfurterischen, wie sie im Vokalläger (2017) publiziert wurden, sind 


größtenteils in die Internetpublikation des 


Frankfurter Aussprachewörterbuch [FAWPB) 
https: / /frankfurterisch.org 


eingeflossen. 
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STIMMEN ZUM VOKALJÄGER (2017) 


Em. Univ. Prof. Dr. Peter Wiesinger, Wien auf der Webseite des Olms-Weidmann Fachverlags 
(httos://www.olms.de /search /Detail.aspx®pr=2009363): 


Carsten Keil gelingt es durch die Verbindung von mathematisch-naturwissenschaftlichen und linguistisch- 
geisteswissenschaftlichen Möglichkeiten, Lautwandlungen im Frankfurter Stadtdialekt im Lauf der letzten 200 
Jahre exakt aufzuzeigen. Von den umgebenden zentralhessischen Dialektverhältnissen stark abweichend, hat 
der Stadtdialekt eigene Wege beschritten, wozu insbesondere der Wandel des gedehnten a gehört. Mit dem 


Vokalläger, einer allgemein nutzbaren algorithmischen Prozesskette zur automatischen Merkmalsklassifikation, 
werden in Verbindung mit robuster Messphonetik und historischer Phonologie die Lautqualitäten exakt ermittelt 
und die daraus resultierenden Lautwandlungen in den sich verändernden lLautsystemen aufgezeigt. Auf diese 
Weise liefert der Autor durch Methodenkombination eine neue Ergebnisse bringende, aufschlussreiche Studie. 


Pia Bergmann, in: Osnabrücker Beiträge zur Sprachtheorie 95 (2019), S. 267-271: 


Es wird (...) deutlich, dass die Arbeit auch über die eigentliche Leistung der Entwicklung und exemplarischen 
Anwendung des Vokaljägers hinaus eine beeindruckende Fülle an Material versammelt, die alleine schon die 
Lektüre lohnt (...) Alles in allem liegt mit dem Buch eine Publikation vor, die - wie der Titel ja auch verrät - ihren 
deutlichen Schwerpunkt in den technischen und methodischen Aspekten des Vokallägers hat (...] Es sei dem Buch 
(...) und seiner zukünftigen Anwendung willen eine vielfache und gründliche Lektüre gewünscht. 


Koloman Brenner, in: Zeitschrift für Deutsche Linguistik ([ZDL), 2019/3, S. 357-359: 


Die phonologische Systematik liefert in diesem Zusammenhang besonders wertvolle Einblicke in die Entwicklung 


der Stadtsprache von Frankfurt. Wie die Ergebnisse der Studie zeigen, die im dritten Teil detailliert geschildert 
werden, kann anhand der untersuchten historischen Dokumente von 1825 bis 1945 eine langsame Entwicklung 
der Frankfurter Stadtsprache nachgewiesen, danach aber eine rapide Veränderung festgestellt werden. (...). 
Zusammenfassend reiht sich das Werk von Keil gut in eine doch immer größere Reihe von messphonetisch 
fundierten Arbeiten zu deutschen Dialekten ein. 


Herrgen, Joachim und Lars Vorberger, in: Rheinfränkisch, in: Deutsch, Sprache und Raum, 2019, S. 504: 


Eine aktuelle sprachdynamische Studie ist Keil (2017), der den Lautwandel in Frankfurt (Übergangsgebiet 
Zentralhessisch, Rheinfränkisch) untersucht. Hier liegt nun eine echt sprachdynamische Studie vor, indem 
verschiedene Zeitabschnitte vergleichbar gemacht und mit modernsten Methoden analysiert werden. Keil 


(2017) klassifiziert Laute dialektintendierter Sprachdaten mit einer phonetisch-algorithmischen Methode und 


kann empirisch nachweisen, dass die A-Verdumpfung in Frankfurt abgebaut wird. 
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KLAPPENTEXT VOKALJÄGER (2017) 


„Der Vokalläger” ist eine algorithmische Prozesskette zur automatisierten Klassifikation 
phonetischer Merkmale in monophthongischen Vokalen. Machine-Learning ermöglicht 
in diesem neuen Ansatz, Merkmalsunterschiede zwischen dialektalen Sprachproben 


und einer hochdeutschen Referenz, hier dem Kiel-Korpus, statistisch zu messen. 


In exemplarischer Anwendung werden historische und moderne Aufnahmen des 
Frankfurterischen aus dem „Lautdenkmal reichsdeutscher Mundarten” und des Projekts 
„Regionalsprache.de (REDE)" analysiert. Die Ergebnisse zeigen insbesondere das 
Verschwinden des charakteristischen dunklen velaren A: War es 1937 noch messbar 
vorhanden, so fehlt es im jüngeren Frankfurter Dialekt. 


Als Bezugspunkt wird der Frankfurter Stadtdialekt rekonstruiert - basierend auf bisher 
noch nicht historisch-phonologisch untersuchten Quellen aus dem Institut für 
Stadtgeschichte Frankfurt am Main. Vor allem die Aufzeichnungen Joseph Oppels 
(1815-1894) und Ludwig Rauhs (1892-1945) erlauben so die real-time Darstellung 
eines Lautwandels des Frankfurterischen über 200 Jahre anhand von 600 hier zum 


ersten Mal gedruckten Belegen. 
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Für Ina W. Redlich 
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Schlafen kann ich, wenn ich tot bin. 
(Rainer Werner Fassbinder) 
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Kapitel 1 


Der VokalJäger - Eine Übersicht 


Zusammenfassung: Der VOKALJÄGER ist eine algorithmische Prozesskette 
zur automatisierten Klassifikation phonetischer Merkmale in monophthongi- 
schen Vokalen. Algorithmische Methoden aus der robusten Messphonetik und 
der mathematischen Klassifikationsalgorithmik bzw. dem Machine-Learning 
kommen zum Einsatz. Der VOKALJÄGER wird auf eine hochdeutsche Refe- 
renz von zehntausend Vokalproben ‚trainiert‘. Dann schätzt er automatisiert 
und ohne menschliche Intervention die statistische Verteilung des sogenannten 
gleitenden phonetischen Merkmals in Tonaufnahmen. So können phonetisch- 
phonologische Hypothesen quantitativ getestet werden, insbesondere ob Lau- 
te qualitativ zusammenfallen (Merger) oder getrennt bleiben. Damit ist der 
VOKALJÄGER ein statistisches Werkzeug der historischen Dialektphonologie. 


Im phonologischen Teil der Arbeit werden die vokalischen Kernphänomene 
des einstigen Frankfurter Stadtdialekts dargestellt - mit Schwerpunkt auf den 
A-Lauten. Die Untersuchung basiert zum einen auf bisher ungedruckten Quel- 
len aus dem Frankfurter Institut für Stadtgeschichte. Dabei handelt es sich 
um die handschriftlichen Lautbelege Joseph Oppels und Ludwig Rauhs aus 
dem Fundus des Frankfurter Wörterbuchs. Zum anderen werden schwerpunkt- 
mäßig ausgewählte historische Tondokumente des Frankfurterischen mit dem 
VOKALJÄGER untersucht, insbesondere die Frankfurter Aufnahme aus dem 
Lautdenkmal reichsdeutscher Mundarten von 1937 und neuere Aufnahmen aus 
dem Projekt Regionalsprache.de (REDE). Mit diesen einmaligen Daten ist es 
zum ersten Mal möglich, den Sprachwandel des Frankfurter Stadtdialekts über 
zweihundert Jahre in Real- Time phonetisch-phonologisch zu untersuchen. 


Es zeigt sich, dass gerade Merger-Phänomene wesentlich sind: Einerseits 
fiel das altlange Ä klanglich mit dem Dehnungs-A: in einem dunklen A zu- 
sammen — ganz unterschiedlich zum Zentralhessisch der Umgebung, das zwei 
getrennte Laute bewahrte. Andererseits ist das dunkle A im Neu-Frankfurte- 
rischen nicht mehr nachweisbar — es ist mit dem neutralen A verschmolzen. 
Abschließend zeigt sich ein Split bei den Vorderzungenvokalen, die nun als 
runde und ungerundete Laute die dialekttypische Entrundung auflösen. Ab- 
bildung 117 auf S.407 fasst abschließend alle Erkenntnisse zusammen. 
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1.1 Einführung 


Der Ausgangspunkt dieser Abhandlung war 2004 eine Untersuchung der Vokale 
des ehemaligen Frankfurter Stadtdialekts - ursprünglich rein aus Sicht der histori- 
schen Dialektphonologie unter Nutzung neuer Schriftquellen. 2013 entstand daraus 
ein Dissertationsprojekt am Deutschen Sprachatlas in Marburg. Zum Frankfurter 
Stadtdialekt, ebenso wie für andere Dialekte des Deutschen, existieren jedoch über- 
dies historische Tondokumente, die bisher kaum ausgewertet wurden, wie z.B. die 
Frankfurter Aufnahme aus dem Lautdenkmal reichsdeutscher Mundarten von 1937. 
Auch im Projekt Regionalsprache.de (REDE) entstanden zahlreiche Frankfurt zu- 
geordnete Sprachaufnahmen. 

So lag es nahe, den Frankfurter Vokalwandel ebenfalls anhand dieser Tondoku- 
mente zu untersuchen. Dazu war es nötig, ein Werkzeug zu schaffen: den VOKAL- 
JÄGER. Der VOKALJÄGER ist eine allgemein nutzbare algorithmische Prozesskette 
zur automatisierten Merkmalsklassifikation und bildet seit 2014 den Schwerpunkt 
dieser Arbeit!. Die Klassifikation erfolgt implizit und quantitativ: Es werden mess- 
und klassifikationsphonetische statistische Modelle genutzt, die auf einem hoch- 
deutschen Referenzdatensatz von zehntausend Vokalproben aus dem Kiel-Korpus 
‚trainiert‘ wurden. So wird der Frankfurter Vokalismus mit Werkzeugen dreier 
Fachbereiche transdisziplinär angegangen: der robusten Messphonetik, der algo- 
rithmischen Klassifikation bzw. dem Machine-Learning und der historischen Dia- 
lektphonologie bzw. der Germanistik. 

Mit diesem Ansatz kommt eine Herausforderung für die hier vorliegende Dar- 
stellung: Das Werkzeug - als algorithmische und statistische Software - ist prinzi- 
piell erst einmal der klassischen Germanistik wesensfremd. Und das Werkzeug ist 
neu. Folglich ist ein großer Teil der Arbeit den technischen Konzepten der algorith- 
mischen Messphonetik (Statistik akustischer Größen) und Klassifikationsphonetik 
(Machine-Learning) gewidmet. Auch muss erst anhand von Testdaten und Experi- 
menten umfänglich gezeigt werden, dass dieser Apparat auch ‚funktioniert‘, bevor 
er mit Dialektproben zum gewünschten Nutzeinsatz kommen kann. 


!Der VOKALJÄGER ist in der Phonetiksoftware PRAAT, der Statistiksoftware R und der 
Scriptsprache Perl programmiert (Boersma/Weenink [2015], R Development Core Team [2015] 
und Wall [1987-2012]). Auf der Webseite VokalJaeger.org finden sich ergänzende Informationen 
zum VOKALJÄGER-Projekt. Der Autor ist unter ckeil@VokalJaeger.org zu erreichen. 
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1.2 Gliederung und Zusammenfassungen der Kapitel 


Tabelle 1 auf S.3 liefert eine Übersicht über die vorliegende Arbeit und eine Zu- 
ordnung der Teile und Kapitel zu den Fachbereichen. Die Arbeit ist grob in drei 
Teile und die Anhänge geteilt. Im Einzelnen besteht die Arbeit in den drei Haupt- 
teilen aus den acht Kapiteln mit den Nummern 2 bis 9, die im Folgenden kurz 
zusammengefasst werden. Dazu kommen Einleitung (dieses Kapitel) sowie Schluss 
und Ausblick (Kapitel 10 ab S. 427). 


— Teil I. Messphonetik, S.15f.: Der erste Teil enthält eine Einführung (Ka- 
pitel 2), den theoretischen Hintergrund und die Beschreibung der messphoneti- 
schen Algorithmik des VOKALJÄGERSs (Kapitel 3) als auch Ergebnisse für das 
Hochdeutsche (Kapitel 4). Die folgenden Kapitel richten sich an den messpho- 
netisch und algorithmisch interessierten Leser. 


— Kapitel 2. Phonetik, Phonologie und der VokalJäger, S.15f.: Die- 
ses Kapitel ist eine einführende Verortung des VOKALJÄGERS in der Be- 
griffswelt der Phonetik, Phonologie und Signaltechnik. Für den VOKAL- 
JÄGER bietet es sich insbesondere an, Phonetik mit den zwei Unterklas- 
sen Klassifikationsphonetik und Messphonetik anzusetzen, deren Trennlinie 
entlang des eingesetzten mathematischen Instrumentariums verläuft. Die 
Messphonetik nutzt den Apparat der Statistik kontinuierlicher Werte, den 
physikalischen Lautsignalen, wie z.B. den Formanten. Klassifikationspho- 
netik verwendet mathematische Klassifikationsalgorithmik, Machine-Lear- 
ning, um aus messphonetischen Größen Wahrscheinlichkeitswerte für das 
Vorliegen ordinaler Werte abzuleiten. Vor allem betrifft dies die Beurtei- 
lung, wie wahrscheinlich es ist, dass in einem messphonetischen Signal ein 
bestimmtes klassifikationsphonetisches Merkmal vorliegt (Abschnitt 2.1 ab 
S.16). Die Vokalsystematik der International Phonetic Association (IPA) 
mit ihren phonetischen Merkmalen wird vorgestellt. Sie bildet den Bezugs- 
rahmen für die Algorithmik des VOKALJÄGERSs (Abschnitt 2.2 ab S. 20). Es 
folgt ein kurzer Abriss des hochdeutschen Vokalsystems, der um Abschnitte 
zu Einzellauten und den deutschen Dialekten ergänzt wird (Abschnitt 2.3 
ab S. 30). 


— Kapitel 3: Algorithmische Messphonetik, S.35f.: Die für den VOo- 
KALJÄGER entwickelte robuste Messphonetik ist die erste Säule der vorlie- 
genden Arbeit. Dieses Kapitel führt die messphonetischen Begriffe und Me- 
thoden ein, welche im VOKALJÄGER zur Anwendung kommen. Der Schwer- 
punkt liegt auf Algorithmen zur hochgradig automatisierten phonetischen 
Auswertung digitaler Sprachdaten, was hier als algorithmische Messpho- 
netik bezeichnet werden soll. Das Kapitel beschreibt sowohl die üblichen 
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Gliederung und Zusammenfassungen der Kapitel d 


messphonetischen Größen (wie die Formanten) als auch die Verfahren, die 
zu ihrer Messung entwickelt wurden. Bei der Darstellung wurde Wert dar- 
auf gelegt, die einzelnen Schritte und Verfahren mit dem Instrumentarium 
des VOKALJÄGERSs nachzuvollziehen und zu dokumentieren. 


Es werden neue Varianten vorgestellt, die sowohl robust gegenüber Mess- 
fehlern als auch gegenüber systematischen Unterschieden zwischen Vokal- 
systemen sind. Damit eignen sie sich besonders für die Verarbeitung alter 
Tonaufnahmen über nicht normierte Sprachkorpora hinweg. Im Einzelnen 
ist dies ein Algorithmus zur Bestimmung der optimalen Formantbahn (Ab- 
schnitt 3.3.4 ab S. 64), ein Mechanismus zur robusten Sprechernormalisie- 
rung (Abschnitt 3.6.7 ab S.91) und die Methode der Rückfaltung zur Er- 
kennung und Korrektur von Ausreißern (Abschnitt 3.6.9 ab S.93). Damit 
ist ein vollautomatisches Analysieren von vorsegmentierten Lautsignalen in 
einer Prozesskette möglich (Abschnitt 3.7 ab S. 103). 


— Kapitel 4. Messphonetische Ergebnisse, S. 111f.: Dieses Kapitel prä- 
sentiert die Ergebnisse der Anwendung der messphonetischen Algorithmen 
des VOKALJÄGERSs auf das Hochdeutsche. Dazu wird das Kiel-Korpus of 
Read Speech exemplarisch mit dem VOKALJÄGER messphonetisch unter- 
sucht und dokumentiert. Die Ergebnisse für die ersten beiden Formanten 
sind in Abbildung 56 auf S.151 dargestellt und entsprechen dem für das 
Hochdeutsche Erwarteten. Die akustischen Größen des Hochdeutschen wer- 
den auch mit einer Referenzaufnahme der Kardinalvokale verglichen. Die 
mit dem VOKALJÄGER gemessenen Muster für das Hochdeutsche decken 
sich mit denen von Vergleichsmessungen (Abschnitt 4.6.4 ab S. 159). Im Er- 
gebnis ist somit der VOKALJÄGER phonetisch auf das Hochdeutsche kali- 
briert, was eine Voraussetzung für die nachfolgenden Klassifikationsschritte 
ist. Die hier gewonnenen Statistiken, insbesondere für die Formanten, sind 
der hochdeutsche Eichpunkt für die Untersuchung von dialektalen Tondo- 
kumenten und deswegen ausführlich in Tabellen und Diagrammen doku- 
mentiert (Abschnitt 4.6.1 ab S. 150). 


— Teil II. Klassifikationsphonetik, S. 169 f.: Der folgende Teil beschreibt die 
Machine-Learning Algorithmik des VOKALJÄGERs (Kapitel 5) und die klassi- 
fikationsphonetische Kalibrierung auf das Hochdeutsche (Kapitel 6). Die Ziel- 
gruppe sind Leser, die an Klassifikationsphonetik mittels Machine-Learning 
interessiert sind. 


— Kapitel 5. Algorithmische Klassifikationsphonetik, S.169f.: Die 
für den VOKALJÄGER entwickelte klassifikationsphonetische Algorithmik 
ist die zweite Säule der vorliegenden Arbeit. Es wird das neue Konzept 
des gleitenden phonetischen Merkmals eingeführt. Dies ermöglicht es, den 
Erwartungswert eines phonetischen Merkmals, wie z.B. der Öffnungsstufe 
der Hinterzungenvokale, zu errechnen: Es ergibt sich der zentrale Merk- 
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malswert Zeta ( (Abschnitt 5.1 ab S.170). Mit den Merkmalswerten kön- 
nen nun Merkmalsdifferenzen zwischen Lautgruppen, den sogenannten Kon- 
trastgruppen, bestimmt werden. Die Analyse der Differenz hinsichtlich ihrer 
Signifikanz erlaubt Schlüsse über das Vorliegen bestimmter Dialektmuster. 
Eine typische Frage wäre z.B.: Unterscheidet sich das Dehnungs-A quali- 
tativ vom neutralen A? Das wäre ein Muster des Frankfurter Stadtdialekts 
(Abschnitt 5.2 ab S. 182). Technisch werden die Merkmalswerte bzw. die zu- 
grundeliegenden Merkmalswahrscheinlichkeiten mit dem Instrumentarium 
des Machine-Learnings bestimmt. Dabei kommen moderne Verfahren wie 
die Support-Vector-Machine (SVM) oder die Mixture-Discriminant-Analy- 
sis (MDA) zum Einsatz (Abschnitt 5.3 ab S. 192). Dazu müssen die Algo- 
rithmen bzw. die sogenannten Binärklassifikatoren auf ausgewählte Binär- 
merkmale des Hochdeutschen ‚trainiert‘ werden (Abschnitt 5.4 ab S. 206). 


— Kapitel 6. Klassifikationsphonetische Ergebnisse, S. 215 £.: Dieses 
Kapitel dokumentiert die Kalibrierung der Klassifikationsalgorithmen auf 
das Hochdeutsche. Es zeigt sich, dass mit der Methode der Mixture-Discri- 
minant-Analysis als Schätzermodell und den ersten drei Formanten als Prä- 
diktorvariablen sehr gute Ergebnisse erzielt werden können (Abschnitt 6.1 
ab S. 216). Die Merkmalswerte, die der VOKALJÄGER für die Öffnungsstufe 
der Hinterzungenvokale und den Rundungsgrad auf hochdeutschen Daten 
und dem REDE-Material errechnet, entsprechen statistisch den Erwartun- 
gen voll (Abschnitt 6.2 ab S. 226). Dies ist in Abbildung 85 auf S. 228 zusam- 
mengefasst. Im Ergebnis ist der VOKALJÄGER vollumfänglich als Werkzeug 
auf das Hochdeutsche kalibriert. Dies schafft die Grundlage für die Unter- 
suchung historischer Tondokumente des Frankfurterischen. 


— Teil III. Frankfurterisch, S.233f£.: Der letzte Teil beschreibt den Frank- 
furter Stadtdialekt allgemein und führt in die genutzten Quellen ein (Kapitel 
7), insbesondere in die für das Frankfurterische untersuchten Tondokumente 
(Kapitel 8). Der Teil schließt mit einer Diskussion der wichtigsten Sprachwan- 
delphänomene des Frankfurter Vokalismus unter expliziter Nutzung des VO- 
KALJÄGERSs (Kapitel 9). Dieser Teil richtet sich an den am Frankfurterischen 
interessierten Leser. 


—- Kapitel 7. Der Frankfurter Stadtdialekt, S.233f.: Es ist ein glück- 
licher Zustand, dass zum Frankfurter Stadtdialekt zwei wesentliche und 
unabhängige Bestandsaufnahmen existieren, die bisher noch nie kompara- 
tiv phonetisch-phonologisch untersucht worden sind. Dabei handelt es sich 
um die handschriftlichen Aufzeichnungen Joseph Oppels zwischen 1839 und 
1894 und Ludwig Rauhs zwischen 1920 bis 1945. Dieses Material ist weit- 
gehend noch nie in voller Präzision gedruckt worden, geht über das Frank- 
furter Wörterbuch hinaus und wird in Auswahl in dieser Arbeit zum ersten 
Mal der Öffentlichkeit vorgestellt. Ergänzt wird Oppel und Rauh um die 
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kurze, aber relevante Beobachtung von Wülcker aus dem Jahr 1877. Dazu 
kommt eine Vielzahl weiterer Belege, unter anderem aus der Mundartdich- 
tung. Das Belegmaterial bildet die dritte Säule dieser Arbeit und wird in 
Kapitel 9 ab S. 283 in Auszügen gedruckt. 


Dieses Kapitel definiert den Begriff Frankfurterisch als die rheinfränki- 
sche Mundart, die sich von den zentralhessischen Dialekten der Umgebung 
unterscheidet und mit dem Gebiet der Stadt zusammenfällt. In dieser Defi- 
nition stirbt der Dialekt um 1945 aus (Abschnitt 7.1 ab S. 234). Weitere Ab- 
schnitte stellen schon vorliegende Untersuchungen zum Frankfurter Stadt- 
dialekt kritisch vor (Abschnitt 7.2 ab S. 242), teilen den Untersuchungszeit- 
raum in sogenannte Hauptperioden (Abschnitt 7.3 ab $. 259) und umreißen 
die Umgebungsdialekte (Abschnitt 7.4 ab S. 262). Abschließend werden alle 
benutzten Quellen und die verwendeten phonetischen Transkriptionsregeln 
dokumentiert (Abschnitt 7.5 ab S. 264). 


—- Kapitel 8. Frankfurter Tondokumente, S.273f.: Die mit dem VOo- 
KALJÄGER untersuchten Tondokumente zum Frankfurter Stadtdialekt und 
den Umgebungsdialekten werden vorgestellt. Das wichtigste Tondokument 
ist die Frankfurter Aufnahme aus dem Lautdenkmal reichsdeutscher Mund- 
arten von 1937, das Frankfurter Lautdenkmal, und damit ein Zeugnis des 
originalen Frankfurter Stadtdialekts kurz vor seinem Untergang 1945. Wei- 
teres Audiomaterial ergänzt die Untersuchung zum Frankfurterischen. Da- 
zu gehören Lautdenkmal-Aufnahmen aus der Frankfurter Umgebung und 
Frankfurter Tonaufnahmen der Wenkersätze aus dem REDE-Projekt aus 
den 2000er-Jahren. 


—- Kapitel 9. Frankfurter Vokale im Wandel, S.283f.: In diesem Ka- 
pitel wird der VOKALJÄGER als phonetisch-phonologisches Werkzeug zur 
Untersuchung ausgewählter vokalischer Phänomene des Frankfurter Stadt- 
dialekts verwendet. Der VOKALJÄGER ergänzt somit die Schriftbelege Op- 
pels und Rauhs um algorithmisch gewonnene Daten aus jüngerer Zeit — 
mit dieser Kombination ist es möglich, den Sprachwandel des Frankfur- 
terischen in Real-Time über zweihundert Jahre, von etwa 1800 bis in die 
frühen 2000er, zu beschreiben. Die Abschnitte dieses Kapitels dokumentie- 
ren jeweils den Vokalismus des Frankfurterischen und analysieren, ob sich 
ein in Real-Time beobachtbarer Lautwandel aus den Schriftbelegen oder der 
VOKALJÄGER-Untersuchung des Frankfurter Lautdenkmals von 1937 und 
der REDE-Aufnahmen aus den 2000ern ergibt. Untersucht werden unter an- 
derem das dunkle Frankfurter A im altlangen A (Abschnitt 9.4 ab S. 306), 
das Dehnungs-A: (Abschnitt 9.5 ab S.319), das gekürzte A (Abschnitt 9.7 
ab S.336) sowie das Monophthongierungs-A (Abschnitt 9.8 ab $.351) und 
die Entrundung (Abschnitt 9.10 ab S.385). Eine Zusammenfassung findet 
sich in Abschnitt 9.11 ab 5.398, welche mit einer vollumfänglichen Referenz 
aller Frankfurter Vokale in Abschnitt 9.12 ab S. 409 abgerundet wird. 
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Es zeigt sich insbesondere, dass das Frankfurterische sein markantes 
dunkles A verlor. Das kurze dunkle A war schon zu Rauhs Zeiten im Ver- 
schwinden begriffen und ist weder im Frankfurter Lautdenkmal noch in den 
jüngeren Aufnahmen zu finden. Das lange dunkle A hingegen existiert noch 
im Lautdenkmal, aber nicht mehr im REDE-Material. Dieser Merger mit 
dem neutralen A ist Zeichen für den Untergang des Frankfurterischen nach 
dem Zweiten Weltkrieg. Die mit dem VOKALJÄGER gemessenen Phänome- 
ne sind in Abbildung 116 auf S. 405 in einer Auswahl zusammengefasst. Die 
wichtigsten Lautwandelvorgänge des Frankfurter Stadtdialekts sind dann in 
Abbildung 117 auf S. 407 abschließend dokumentiert. Tabelle 58 auf S. 412 
ergänzt eine phonetisch-phonologische Gesamtübersicht über den Frankfur- 
ter Vokalismus. 


- Anhänge, S.435f.: In den Anhängen werden allgemeine statistische Metho- 
den beschrieben sowie spezielle mathematische, messphonetische oder klassi- 
fikationsphonetische Ergänzungen, die eher technischer Natur sind, beigefügt. 
Ebenso sind hier zusätzliche Messergebnisse dokumentiert. 


— Akronyme: Ein Verzeichnis der technischen Abkürzungen und Variablen des 
VOKALJÄGERS sowie Laut- und Schriftzeichen als auch Belegsiglen, jeweils mit 
kurzer Erläuterung und Querverweis. 


— Belegverzeichnis: Dieses Verzeichnis führt die Wortstämme auf, zu denen in 
Kapitel 9, Frankfurter Vokale im Wandel, Schriftbelege aus den Originalquel- 
len gedruckt und untersucht werden. Die erschlossene frankfurterische Form ist 
ebenfalls beigegeben, so dass dieser Index ein kleines historisches Aussprache- 
wörterbuch des Frankfurter Stadtdialekts darstellt. 


— Index: Eine übergreifende Stichwortreferenz. 
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1.3 Übersicht über die Prozessschritte des VokalJägers 


In diesem Abschnitt folgt eine kurze Übersicht über die einzelnen Prozessschritte 
des VOKALJÄGERSs im Kontext der Lauterzeugung und Laut- bzw. Merkmalser- 
kennung. Abbildung 1 auf S.10 stellt den Ablauf in einem Blockdiagramm dar. 


— Phonologische Regel (Block 1): Am Anfang steht das phonologische Regel- 
werk. Dieses legt fest, welche Laute bzw. Merkmale in der vorliegenden Sprache 
oder dem vorliegenden Dialekt vorkommen und welche bedeutungsunterschei- 
dend sind. Das Regelwerk hat eine historische Komponente. In einem Dia- 
lekt kommen eine regionale und eine soziologische hinzu. Das Erschließen bzw. 
Rückerschließen dieses Regelwerks für einen Dialekt, wie z.B. für das Frank- 
furterische, ist eine Zielsetzung der historischen Dialektphonologie. 


—- Ausgehender Laut (Block 2): Der Sprecher formt einen abstrakten Code 
aus den Bausteinen, die ihm das phonologische Regelwerk vorschreibt. Da- 
mit wird die Information codiert, die der Sprecher dem Empfänger zukommen 
lassen möchte. Der Einzelbaustein des Codes ist der Laut, die abstrakte moto- 
rische ‚Steueranweisung‘ an den Sprechapparat. In seiner abstrakten Form ist 
der Laut sprecher- und insbesondere geschlechtsunabhängig. 


— Sprechapparat und Lautschall (Block 3-4): Der physische Artikulati- 
onsapparat des Sprechers exekutiert die Steueranweisung des abstrakten Lauts 
und erzeugt den physikalischen Lautschall. Dabei wird dem Laut eine physio- 
logische Sprechercharakteristik aufgeprägt. So tendieren z.B. Frauen im Ge- 
gensatz zu Männern zu tendenziell höheren Frequenzen bei der Realisation 
desselben abstrakten Lauts, was physikalisch durch den vergleichsweise kürze- 
ren Vokaltrakt bedingt ist. Der Lautschall ist der Ausgangspunkt des hörenden 
Verstehens beim menschlichen Empfänger der Lautbotschaft. 


- Hörapparat (Block 5): Der Lautschall wird vom physischen auditorischen 
Apparat des Empfängers der Sprachnachricht aufgenommen. 


- Empfangener Laut (Block 6): Der kognitive Prozess der menschlichen 
Lauterkennung decodiert den Lautschall klassifikationsphonetisch. Ist der Emp- 
fänger ein Phonetiker, kann er den gehörten (empfangenen) Laut nach seinem 
geschulten Gehör ohrenphonetisch in eine Lautschrift transkribieren und so 
klassifizieren. Für den VOKALJÄGER dient dies als Referenz bwz. Test, denn 
mit dem Laut und seinen Eigenschaften sind auch die den Laut auszeichnenden 
Merkmale festgelegt. 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


10 Der VokalJäger - Eine Übersicht 


Phonologische Regel 


Sprecher 


2] Ausgehender Laut 
3] Sprechapparat 


EI Lautschall R Lautschallsignal 


Vokalläger 


Messwert 


Empfänger 


= Hörapparat 
6] Empfangener Laut + 


Abbildung 1: Die Prozesskette des VOKALJÄGERS: Der linke Ast beschreibt die 
menschliche Lauterzeugung und das menschliche Lautverstehen. Der rechte Ast stellt 
die algorithmische Prozesskette des VOKALJÄGERS dar. 
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— Lautschallsignal (Block 7): Das Lautschallsignal ist das physikalische Mani- 
fest des Lauts als Datensatz (z.B. als Schallplatte). Hier sind alle technischen 
Fragestellungen, wie etwa die Aufnahmequalität und -art, von maßgeblicher 
Bedeutung. 


— Messwert und Lautsignal (Block 8): Die messphonetischen Methoden 
des VOKALJÄGERS greifen auf das Lautschallsignal in digitaler Form zu. Aus 
diesem wird ein Lautsignal akustischer Messwerte bestimmt, die für den im 
Lautschallsignal übertragenen Laut aufschlussreich und im Idealfall eindeutig 
repräsentativ sind. Für den VOKALJÄGER werden z.B. mit der Phonetiksoft- 
ware PRAAT Formanten in Rohform gemessen. Diese Messwerte eignen sich 
jedoch in der Regel nicht unmittelbar direkt zur Klassifikation von Lauten und 
müssen nachprozessiert werden. 


—- Normalisierung (Block 9): In dem Bearbeitungsschritt der Normalisierung 
bzw. Bereinigung werden für die Lautklassifikation irrelevante und störende In- 
formationen aus dem akustischen Messwert eliminiert. Die wichtige Sprecher- 
normalisierung ist das Herausrechnen von Spezifika, die nur durch den phy- 
siologischen Artikulationsapparat des Sprechers bedingt sind. Diese Spezifika 
haben nichts mit dem Laut in seiner abstrakten Reinform zu tun und ver- 
hindern ein sprecherübergreifendes Vergleichen der Messwerte. Die Verfahren 
müssen zwingend robust gegenüber statistischen Störungen und systematischen 
Verzerrungen konstruiert werden. Der Messwert wird damit zum Lautsignal der 
akustischen Größe. 


— Akustische Größe (Block 10): Die akustischen Größen sind die messphone- 
tischen statistischen Variablen im VOKALJÄGER und dienen der Klassifikation 
von Lauten nach Mustergruppen mit bestimmten Merkmalen, den binären pho- 
netischen Einzelmerkmalen. Das Lautsignal der akustischen Größe soll insbe- 
sondere sprecherunabhängig sein und entsteht aus dem Lautsignal des akusti- 
schen Messwerts durch mathematische Transformationen, die Bereinigung und 
Normalisierung zum Ziel haben. Die Prozesskette der Lautsignaltransformatio- 
nen, Messwert — Normalisierung — akustische Größe, kann zyklisch sein. So 
mögen z.B. Ergebnisse der Normalisierung zur Identifikation und gegebenen- 
falls Eliminierung von extremen Messwerten verwendet werden. Auch kann ei- 
ne akustische Größe selbst abermals einer Normalisierung oder Transformation 
unterworfen werden und eine neue akustische Größe formen. Die Normalisie- 
rung des VOKALJÄGERS ist robust gegenüber Messfehlern und dem Wechsel 
von Sprachkorpora. 


— Phonetisches Binärmerkmal (Block 11): Das sogenannte phonetische Bi- 
närmerkmal des VOKALJÄGERS zeigt an, ob ein Laut, repräsentiert durch das 
Lautsignal der akustischen Größen, einer bestimmten Mustergruppe zugehört 
oder nicht. Die Mustergruppe wiederum ist durch bestimmte, sie repräsentie- 
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rende Laute, die sogenannten Stützlaute, definiert. Ein Beispiel ist das Binär- 
merkmal, das anzeigt, ob ein Laut ‚rund‘ ist oder nicht — wobei ‚rund‘ hier 
durch Ähnlichkeit mit den Stützlauten [y:/o:/ce] repräsentiert wird. Mittels 
algorithmischer Klassifikationsmethodik schätzt der VOKALJÄGER die Wahr- 
scheinlichkeit, dass ein Binärmerkmal in einem Lautsignal vorliegt. Dazu ver- 
wendet der VOKALJÄGER sogenannte Binärklassifikatoren aus dem Repertoire 
des Machine-Learnings. 


— Gleitendes Merkmal (Block 12): Verschiedene Binärmerkmale bilden in 
Kombination ein Ensemble, welches für ein phonetisches Merkmal steht, das nä- 
her untersucht werden soll, z.B. die Öffnungsstufe der Hinterzungenvokale. In 
diesem Ensemble ist jedem Binärmerkmal eine sogenannte numerische Elemen- 
tarausprägung zugewiesen. Als Beispiel nehme man die Binärmerkmale ‚offen‘, 
‚„halboffen‘, ‚halbgeschlossen‘ und ‚geschlossen‘, die die Elementarausprägungen 
4, 3, 2 und 1 aufweisen. Die Kernidee ist nun, dass das dem Ensemble zuge- 
ordnete Merkmal zwischen den Elementarausprägungen gleitet und numerisch 
kontinuierliche Zwischenwerte annehmen kann, die sonst z.B. mit Diakritika 
notiert werden. Das Merkmal ist somit nicht mehr klassisch binär bzw. dis- 
kret, wie etwa bei Jakobson u.a. (1965), sondern ein gleitendes phonetisches 
Merkmal. 


— Merkmalswert ( (Block 13): Mathematisch-technisch wird nun der Erwar- 
tungswert der Elementarausprägungen im Ensemble errechnet und als Merk- 
malswert ( (Zeta) bezeichnet. Der Merkmalswert ist eine kontinuierliche Größe 
und die neue, zentrale Maßzahl des VOKALJÄGERSs. Der Merkmalswert ( wird 
so errechnet, dass der quantalen Struktur der Laute Rechnung getragen wird: 
Nur signifikante und deutliche Abweichungen von einer Elementarausprägung 
führen zu einem Ergebnis, was numerisch vom Wert der Elementarausprägung 
differiert. Das gleitende phonetische Merkmal ist ein statistisches Maß. Mit die- 
sem Konzept ist es möglich, wahrscheinlichkeitsgewichtete Merkmalsdifferenzen 
zu bestimmen und so z.B. zu testen, ob in in einem Dialekt ein bestimmtes 
Muster vorliegt oder nicht. 


- Geschätzter Laut (Block 14): Theoretisch möglich wäre es, alle Informa- 
tionen zu kombinieren und den abstrakten klassifikationsphonetischen Laut zu 
benennen, der am wahrscheinlichsten gesprochen wurde. Doch im Rahmen des 
VOKALJÄGERS, der auf Merkmale fokussiert, ist dies nachrangig und wird nicht 
durchgeführt. 


Mit dem VOKALJÄGER kann man so Hypothesen der historischen Dialektpho- 
nologie quantitativ testen (etwa prüfen, ob das Dehnungs-A im Frankfurterischen 
noch verdunkelt ist). Phonetische Dialektalitätsmessung und quantitative phoneti- 
sche Wörterbucheinträge sind damit möglich. Die Schaffung und Messbarmachung 
einer statistisch definierten Lautklangeigenschaft mit dem VOKALJÄGER ist das 
wesentliche neue Element. 
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Kapitel 2 


Phonetik, Phonologie und der Vokal Jäger 


Zusammenfassung: Dieses Kapitel ist eine einführende Verortung des VOKAL- 
JÄGERSs in der Begriffswelt der Phonetik, Phonologie und Signaltechnik. Für 
den VOKALJÄGER bietet es sich insbesondere an, Phonetik mit den zwei Un- 
terklassen Klassifikationsphonetik und Messphonetik anzusetzen, deren Trenn- 
linie entlang des eingesetzten mathematischen Instrumentariums verläuft. Die 
Messphonetik nutzt den Apparat der Statistik kontinuierlicher Werte, den 
physikalischen Lautsignalen, wie z.B. den Formanten. Klassifikationsphone- 
tik verwendet mathematische Klassifikationsalgorithmik, Machine-Learning, 
um aus messphonetischen Größen Wahrscheinlichkeitswerte für das Vorlie- 
gen ordinaler Werte abzuleiten. Vor allem betrifft dies die Beurteilung, wie 
wahrscheinlich es ist, dass in einem messphonetischen Signal ein bestimm- 
tes klassifikationsphonetisches Merkmal vorliegt (Abschnitt 2.1 ab S.16). Die 
Vokalsystematik der International Phonetic Association (IPA) mit ihren pho- 
netischen Merkmalen wird vorgestellt. Sie bildet den Bezugsrahmen für die 
Algorithmik des VOKALJÄGERs (Abschnitt 2.2 ab S.20). Es folgt ein kurzer 
Abriss des hochdeutschen Vokalsystems, der um Abschnitte zu Einzellauten 
und den deutschen Dialekten ergänzt wird (Abschnitt 2.3 ab S.30). 
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2.1 Begriffe 


Dieser Abschnitt verortet das Konzept des VOKALJÄGERS in der klassischen Be- 
griffswelt der Phonetik, Phonologie und Signaltechnik. Der VOKALJÄGER versteht 
sich als ein algorithmisches Werkzeug zur Lautklassifikation. Was ist ein Laut? 
Ein Laut soll hier definiert sein als ein symbolischer Code, der die artikulatorisch- 
auditorische Spezifikation des Sprechakts hinsichtlich der gewünschten Informati- 
onsübermittlung umfasst. Dies entspricht einer Symbolcodierung der ‚Prozessan- 
weisung‘ des Sprechprozesses an den artikulatorischen Sprechapparat, mit dem Ziel 
auditorisch relevante Information zu produzieren. In dieser Definition ist ein Laut 
ein abstraktes Symbol und unabhängig von der Physiognomie des Sprechers und 
der Physik des Sprechens. Der Laut soll durch einen Satz von in der Regel artiku- 
latorisch motivierten Merkmalen beschrieben werden (vgl. Abschnitt 2.2 ab S. 20). 
Der beim Sprechakt des Lauts erzeugte und beim Empfänger gehörte Schall sei hier 
als Lautschall definiert (also die Luftdruckwellen, die physikalisch die Sprachinfor- 
mation transportieren). Somit steht der Laut als abstrakte sprecherunabhängige 
und symbolisch codierte Prozessanweisung seinem physikalischen Manifest, dem 
sprecherabhängigen Lautschall, als Ergebnis, gegenüber. 

Für den Laut als Symbol stellen sich verschiedene Fragen: Wie umfangreich und 
detailliert soll die Spezifikation der Prozessanweisung sein? Welches Referenzsys- 
tem soll verwendet werden? Welcher Satz von Symbolen soll zur Anwendung kom- 
men? Der Detailgrad der Spezifikation durchläuft ein Kontinuum. Auf der einen 
Seite stehen Elemente der artikulatorischen Spezifikation, die für die Informations- 
übermittlung prinzipiell irrelevant sind und hier ausgeschlossen werden können?. 
Auf der anderen Seite steht eine extreme Abstraktion auf den Satz der (weni- 
gen) unterschiedlichen Spezifikationen, die hinsichtlich Bedeutungsunterscheidung 
signifikant und relevant sind. Dieser Satz, die Lautmuster, bilden das Referenzsys- 
tem der Sprache bzw. des Dialekts und die hier elementar unterschiedlichen Spe- 
zifikationen werden mit Lautzeichen als Symbolcodes versehen. Die Lautmuster 
sind Abstraktionen einer Gruppe von unterschiedlichen Lauten bzw. Lautvariatio- 
nen, die zwar artikulatorisch-auditorisch unterschiedlich sind, aber innerhalb des 
Referenzsystems keine Bedeutung unterscheiden. Das im VOKALJÄGER verwen- 
dete Symbolcodesystem ist das der IPA (vgl. Abschnitt 2.2.1 ab S.20). Von dem 
System der Symbole für die Lautmuster, den elementar unterschiedlichen Spezi- 
fikationen, ausgehend, werden dann Symbole für weitere nicht bedeutungsunter- 
scheidende Laute als Variationen zugefügt, die sich relativ auf die Elementarspezi- 
fikation beziehen. Somit codiert jedes Lautsymbol implizit eine sprachenspezifische 
Spezifikation: In der Regel sind durch ein und dasselbe Lautsymbol codierte Spe- 


?Vgl. hier z.B. die quantal theory of speech in Stevens (1989), die besagt, dass Änderung des 
Artikulationsapparats über einen bestimmten Bereich keine auditorisch wesentliche Änderung 
des Lautschallsignals nach sich zieht. 
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zifikationen zwischen zwei Sprachen unterschiedlich. Für den VOKALJÄGER wird 
das hochdeutsche Lautsystem als Referenzsystem angesetzt und alle Symbolcodie- 
rungen beziehen sich entsprechend auf das Hochdeutsche. 

Traditionsgemäß fällt das eben Gesagte in die Bereiche der Phonetik, Phono- 
logie und Signaltechnik. Kohler (1995, 22) definiert: 


„Der Gegenstand der Phonetik ist das Schallereignis der sprachlichen Kommunikation in all 
seinen Aspekten, d. h. die Produktion, die Transmission und die Rezeption von Sprachschall 
einschließlich der psychologischen und soziologischen Voraussetzung in der Kommunikati- 
onssituation zwischen Sprecher und Hörer, wobei sowohl symbol- als auch messphonetische 
Betrachtungsweisen dieses Objekt prägen.“ 


In dieser Definition umfasst Phonetik sowohl den Laut als Symbolspezifikation 
als auch den Lautschall. Für den VOKALJÄGER erscheint es angebracht, auf den 
genannten Unterklassen der Phonetik aufzubauen, aber sie in Richtung Signal- 
technik zu ergänzen: Die Lehre vom Laut als abstrakte Spezifikation bzw. als 
Merkmalsbündel sei hier als Klassifikationsphonetik bezeichnet (alternativ: Sym- 
bolphonetik). Die Lehre vom Lautschall und daraus abgeleiteter Größen sei hier als 
Messphonetik bezeichnet (alternativ: Instrumental- oder Experimentalphonetik). 
Der Lautschall kommt nicht notwendigerweise direkt und unverfälscht beim 
Empfänger an: Dazwischen liegt oft ein Übertragungskanal, wie z.B. ein Telefon 
oder der Weg über eine Schallplatte. Damit werden zusätzlich signaltechnische 
Problemstellungen wie Aufnahmequalität und Übertragungsbandbreite relevant. 
Die Datenrepräsentation Lautschallsignal ist der Startpunkt für den VOKALJÄ- 
GER (z.B. Audiosignal als Zeitreihe von digitalisierten Druckschallwerten). Der 
VOKALJÄGER durchläuft konzeptionell den Spracherzeugungsprozess in umge- 
kehrter Weise. Er startet mit dem Lautschallsignal (Messphonetik) und schätzt 
den ursprünglichen Laut bzw. das ursprüngliche Merkmal als Abstraktum (Klas- 
sifikationsphonetik). Aus dem Lautschallsignal werden dazu repräsentative Signal- 
komponenten als Messwerte extrahiert, die sich für eine Verarbeitung eignen: das 
Lautsignal. Aus einem sprecher- und aufnahmeabhängigen Lautsignal (z.B. For- 
manten in Rohform) wird durch Transformation und Normalisierung ein reprä- 
sentatives, sprecher- und technikunabhängiges Lautsignal, die akustische Größe, 
geschaffen (z.B. mit der Methode der robust lobanovnormalisierten Formanten). 
Messphonetik ist also für den VOKALJÄGER das algorithmische Prozessieren von 
akustischen Messwerten als Lautsignal, ausgehend vom Lautschallsignal und en- 
dend in der akustischen Größe. Die messphonetisch ermittelten akustischen Größen 
wiederum sind der Startpunkt für den Klassifikationsalgorithmus des VOKALJÄ- 
GERS. In einer Kaskade von Rechenschritten wird mit Methoden der Klassifika- 
tionsstatistik errechnet, wie wahrscheinlich sogenannte binäre Einzelmerkmale in 
dem messphonetischen Signal vorliegen. Der Algorithmus des VOKALJÄGERSs wird 
mit ausgewählten Lauten, den Stützlauten, die repräsentativ für die betreffenden 
Merkmale sind, darauf ‚trainiert‘, diese zu ‚erkennen‘. Es ergibt sich dann der so- 
genannte Wert des gleitenden phonetischen Merkmals (, die zentrale statistische 
Größe des VOKALJÄGERs. Mit dieser Größe ist es möglich, zu bestimmen, ob ein 
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gewähltes Muster des Dialekts - z.B. ist das A verdunkelt? — vorliegt oder nicht 
(vgl. Kapitel 5 ab S. 169). Für den VOKALJÄGER verläuft die Trennlinie zwischen 
Messphonetik und Klassifikationsphonetik entlang des mathematisch algorithmi- 
schen Instrumentariums des VOKALJÄGERSs. Messphonetik nutzt Algorithmik und 
Statistik kontinuierlicher Werte, den akustischen Größen. Klassifikationsphonetik 
nutzt Klassifikationsalgorithmik -— Machine-Learning - und Statistik hinsichtlich 
ordinaler Klassen, den Lauten bzw. den Merkmalen. 

Die Frage nach dem elementaren Bezugssystem der bedeutungsunterscheiden- 
den Laute ist Aufgabe der Phonologie. Für Trubetzkoy (1958, 7) war es noch in den 
1930er-Jahren wichtig, eine strenge Trennung der Phonologie von der Phonetik zu 
fordern: 


„Es empfiehlt sich daher, statt einer einzigen zwei verschiedene Lautlehren einzuführen, von 
denen die eine auf den Sprechakt, die andere auf das Sprachgebilde gerichtet zu sein hat. 
Entsprechend ihrem verschiedenen Gegenstand müssen die beiden Lautlehren ganz verschie- 
dene Arbeitsmethoden anwenden: die Sprechaktlautlehre, die mit konkreten physikalischen 
Erscheinungen zu tun hat, muss naturwissenschaftliche, die Sprachgebildelautlehre dagegen 
rein sprach- (bzw. geistes- oder sozial-) wissenschaftliche Methoden gebrauchen.“ 


Eine solche harte Trennung erscheint heute nicht mehr adäquat. Kohler (1995, 22) 
merkt dazu an: 


„Was bei diesen Einreihungen übersehen wird, ist, dass sich Methoden innerhalb einer Wis- 
senschaft vielfältig durchdringen und dass eine simple Zweiteilung die wissenschaftliche Wirk- 
lichkeit, verfälscht. Eine Phonologie kann mit Gewinn exakte instrumentelle Methoden an- 
wenden, eine Instrumentalphonetik kann und muss sich die Erkenntnisse phonologischer Ge- 
gensätze und Strukturen zunutze machen.“ 


Aus der Sicht des VOKALJÄGERSs ist Phonologie zum einen der extreme Grenzfall 
der abstrahierenden Klassifikationsphonetik: eine Inventarphonologie als die Lehre 
vom Inventar der Lautmuster, welches eine Sprache definiert. Sie basiert auf der 
Phonetik. So schreibt Ohala (2013, 671): „a characterization of phonology as the 
discipline |...] that seeks answers the questions by employing methods, data and 
theories from phonetics“. Zum anderen ist Phonologie aber auch hier eine eigen- 
ständige geisteswissenschaftliche Komponente, indem sie nach dem Warum und 
Woher der Lautmuster fragt: Sie ist eine Entwicklungsphonologie. 

Der üblichen Konvention folgend wird hier der bedeutungsunterscheidende Laut 
(das Lautmuster, der Baustein des elementaren Spezifikationssystems, das soge- 
nannte Phonem) symbolisch in Schrägstrichen gesetzt: /./. Der phonetische Laut, 
im Unterschied zum stärker abstrahierten phonemischen Lautmuster, wird in ecki- 
gen Klammern gedruckt: [.] - letztere ist die in dieser Arbeit übliche Schreibweise. 
Abbildung 2 auf S. 19 fasst die hier beschriebene Terminologie und den Bezug auf 
den VOKALJÄGER zusammen. 
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2.2 Das Konzept Vokalsystem und Merkmal 


2.2.1 Vokalische Eigenschaften und das IPA-Vokalinventar 


Der VOKALJÄGER beschränkt sich in seinem derzeitigen Entwicklungsstand auf 
Vokale, genauer: betonte Monophthonge. Mit dieser Lautklasse lassen sich die we- 
sentlichen Dialektmuster des Frankfurterischen untersuchen, was die Nutzanwen- 
dung des VOKALJÄGERS in dieser Arbeit ist (vgl. Abschnitt 9 ab S. 283). Vokale 
sind Laute, die mit periodischer Stimmbandschwingung erzeugt werden und bei 
denen der den Ton transportierende Luftstrom aus dem Mund austritt. Für das 
Frankfurterische sind ferner Nasalvokale interessant — hier tritt auch Luft aus der 
Nase aus. Analysemöglichkeiten für Konsonanten und Halbvokale sind zurzeit noch 
nicht im VOKALJÄGER implementiert. 

In diesem Abschnitt soll der Frage nach dem Inventar der wesentlich unter- 
schiedlichen Laute nachgegangen werden. Was ist das klassifikationsphonetische 
Ordnungsschema? Das idealisierte Referenzinventar der vokalischen Monophthon- 
ge — dem heutigen phonetischen Standard der International Phonetic Association 
IPA (1999) folgend — ist in Tabelle 2 auf S.21 aufgelistet und in Tabelle 3 auf 
S.22 zusammengestellt. Die IPA-Zeichen eignen sich zum Druck, aber nicht für 
eine Maschinenverarbeitung. Dazu wurde die Speech Assessment Methods Phone- 
tic Alphabet (SAMPA) Codierung eingeführt, die ebenfalls in der Tabelle abge- 
druckt ist (Kohler [1994, 20-21] und Gibbon u.a. [1997, 684-732]). Der originale 
SAMPA-Code wurde für die Nutzung im VOKALJÄGER leicht abgeändert, um das 
Steuerzeichen ‚\‘ zu eliminieren. Das IPA-Vokalinventar ist an den sogenannten 
Kardinalvokalen (cardinal vowels) ausgerichtet, die Anfang des 20. Jahrhunderts 
von Daniel Jones definiert wurden?. Die Kardinalvokale sind in den Tabellen 2 und 
3 auf S. 2 auf S.21f. mit einer Nummerierung markiert. Der Ziffernkreis 1 bis 8 
bezeichnet die primären Kardinalvokale (primary cardinal vowels), der Ziffernkreis 
9-16 die sekundären Kardinalvokale (secondary cardinal vowels) sowie 17 und 18 
die ergänzenden Kardinalvokale. Die übliche Darstellung der IPA-Kardinalvokale 
und übrigen IPA-Vokale ist die Anordnung in einem Vokalviereck oder Vokaltrapez, 
vowel quadrilateral, wie in Abbildung 3 auf S. 22. Das IPA-Vokalschema ordnet und 
unterscheidet in der Klassifikation die Vokale nach Eigenschaften, die an die Kon- 
figuration des Artikulationsapparates angelehnt sind. Die Hauptordnungseigen- 
schaften der IPA sind die Öffnungsstufe des Mundes (bzw. der Grad der Öffnung 
zwischen Zunge und Gaumen), die Lage der Zunge und die Rundung der Lippen. 
Die Ausprägungen dieser Eigenschaften sind für die Öffnungsstufe: geschlossen, 


®Daniel Jones sprach in den 1950er-Jahren seine Kardinalvokale auf Schallplatte ein und 
legte Erläuterungen bei, die hier als Referenz angesetzt werden (Jones 1956, 10-12). Zu dieser 
Schallplattenaufnahme, vgl. Abschnitt 4.1.3 ab S.113 und zur messphonetischen Auswertung im 
VOKALJÄGER, vgl. Abschnitt 4.6.2 ab S. 154. 
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BR OB - 1)”. O Bird 
x i 1 i i geschlossen, ungerundet, vorne 10 v d 
I I 1 geschlossen, ungerundet, vorne, ungespannt 15 v d 
x e 2 e e halbgeschlossen, vorne, ungerundet 2,0 v d 
x» € 3 E  E  halboffen, vorne, ungerundet 3,0 v d 
a { {etwas offen, vorne, ungerundet 35. u 
x» a 4 a a offen, vorne, ungerundet 40 v d 
x a 5 4A A offen, hinten, ungerundet 40 h 
x» 5». 6 0 0 halboffen, hinten, rund 30h rd 
* 0 7 0 0  halbgeschlossen, hinten, rund 20h rd 
Ü U U geschlossen, hinten, rund, ungespannt 15 h rd 
* u 8 u u geschlossen, hinten, rund 10h rd 
o y 9 y .y geschlossen, vorne, rund 10 vr cd 
Y Y _Y geschlossen, vorne, rund, ungespannt 15 vr d 
o 6 10 2 2 halbgeschlossen, vorne, rund 20 vr d 
o © 11 9 9 halboffen, vorne, rund 30 vr cd 
o ® 12 & & offen, vorne, rund 40 vr 
o» 123 Q 09 offen, hinten, rund 40 hr 
o Aa 14 V V  halboffen, hinten, ungerundet 30. h 
o x 15 7 7  halbgeschlossen, hinten, ungerundet 20 h 
o w 16 M _M geschlossen, hinten, ungerundet 10 h 
+ 17 1 1 geschlossen, zentral, ungerundet 10 2 
u 18 } } geschlossen, zentral, rund 1,00. 
9 C@\ 5  halboffen, zentral, ungerundet 20 2 
o 8 8  halboffen, zentral, rund 20 z r 
e) © @ zentrales E-Schwa 25 2 d 
3 3 2 halboffen, zentral, ungerundet 3,0 z 
G 3\ 4  halboffen, zentral, rund 30 z r 
® 6 6 offenes A-Schwa 35 2 d 


Tabelle 2: Die Vokale in der Darstellung der International Phonetic Association 
(IPA). Die acht primären Kardinalvokale sind mit einem ‚x markiert, die acht se- 
kundären mit einem ‚o‘. Sl: Maschinenlesbarer SAMPA-Code (ebenso verwendet im 
Kiel-Korpus; vgl. Abschnitt 4.1.2 auf $.113); S2: SAMPA-Variante des VOKALJÄ- 
GERS; C: Kardinalvokalnummer; Ö: numerische Repräsentation der Öffnungsstufe; L: 
Lage des Vokals mit (v)orne, (z)entral, und (h)inten; (r)unde Vokale sind markiert, 
ebenso die phonemischen Laute des Standardhoch(d)eutschen. Das Lautzeichen [a] 
wird später im Text zur Bezeichnung des dunklen A-Lauts im Frankfurterischen ver- 
wendet werden, welcher lautlich eher dem IPA-[5] entspricht (vgl. Abschnitt 9.4.1.1 
ab S.307). 
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Ö vorne zentral hinten 

r r 1 

geschlossen 1,0 i y } u u u 

1,5 I Y U 

halbgeschlossen 20 e © 93.0 vo 
2,8 9 

halboffen 30.8 © 3 6) A 9 
3,9 e 

offen 40 a © an» 


Tabelle 3: Vollständiges Vokalinventar der International Phonetic Association 
(IPA). Die primären Kardinalvokale sind fett gedruckt. Spalte ‚r‘ markiert die Vari- 
ante mit Rundung. Spalte ‚Ö' ist eine numerische Repräsentation der Öffnungsstufe. 


i>% ı u u u 
ı Y Ü 
e o 93.0 vo 
9 
Ee @ 3.8 A 9 
e 
a © an 


Abbildung 3: Das IPA-Vokalviereck in der üblichen Darstellung. Von links nach 
rechts: vordere, zentrale und hintere Vokale; in Paaren ist der linke Vokal ungerundet 
und der rechte rund; von oben nach unten: geschlossene, halbgeschlossene, halboffene 
und offene Vokale. Die primären Kardinalvokale sind in Fettdruck gesetzt. 
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halbgeschlossen, halboffen und offen; für die Lage: vorne, zentral und hinten; für 
die Rundung: ungerundet (auch: ‚gespreizt‘ oder ‚nicht rund‘) und rund?. Im IPA- 
Vokalviereck bestimmt die Rigenschaft Öffnungsstufe die Vertikale (die Zeile); die 
Eigenschaft Lage grob die Horizontale (Spalte) und die Eigenschaft Rundung die 
Feineinteilung auf der Horizontalen. Die IPA-Kardinalvokale stellen extreme Ar- 
tikulationsvarianten dar, die in dieser Reinform in kaum einer Sprache existieren. 
Jones (1956, 7) schreibt: 


„It must always be borne in mind that the Cardinal Vowels cannot be described by reference 
to the actual vowels of any language. It is the vowels of a languages which have to be described 
by reference to the cardinal vowels.“ 


Die mit gleichen Symbolcodes bezeichneten Laute einer einzelnen Sprache sind in 
der Regel mit einer weniger extremen Artikulation gesprochen. So weichen mit 
IPA (1999, 13) die realen Realisationen von den Referenzlauten zum Teil deutlich 
in Klang und Artikulation ab: 


„Since the vowel space is continuous, it is a matter of chance whether a vowel in language 
exactly coincides with one of the reference points symbolized in the quadrilateral. In parti- 
cular, languages may use vowels which are similar to, but not as peripheral as, the reference 
points indicated by the cardinal vowels. [...| [MJost vowels in a language can be placed in a 
relation to a reference vowel.“ 


Auch das Hochdeutsche unterscheidet sich klassifikations- und messphonetisch von 
den IPA-Kardinalvokalen (vgl. zu den gemessenen Abweichungen Abschnitt 4.3.1 
ab S.124)°. 

Basierend auf den maximal möglichen Stellungen des menschlichen Artiku- 
lationsapparates sind die vier Extremvokale (in der englischsprachigen Literatur 
extreme vowels) |i/a/a/u] definiert, die dann die primären Kardinalvokale 1, 4, 5, 
und 8 bilden. Der erste Extremvokal und Kardinalvokal Nr. 1 ist das |i]. Die Lage 
der Zunge ist maximal vorne und die Öffnungsstufe zwischen Zunge und Gaumen 
ist minimal geschlossen. Das [i] stellt den Eichpunkt des IPA-Vokalsystems dar: 


„[---] the body of the tongue is displaced forwards and upwards in the mouth, towards the 
hard palate. [...] This extreme vowel is taken as a fixed reference point for vowel description. 
Since the tongue is near the roof of the mouth this vowel is described as ’close’, and since the 
highest point of the tongue is at the front of the area where vowel articulations are possible, 
it is described as ’front’“ (IPA 1999, 11). 


Bei Jones (1956, 14) ist es „the ’closest’ possible kind of i. Near to the French 
sound of iin si, German sound of ie in Biene“. Der Extremvokal mit der größten 
Öffnungsstufe, offen (open), und der zungvordersten Lage, vorne (front), ist defi- 
niert als [a] (Kardinalvokal Nr.4). Bei maximal geöffnetem Mund, ist die Frage 


*7um Schriftsatz: Die Ausprägung eines Merkmals ist im Text nur explizit dort markiert 
(mit Anführungsstrichen, z.B. ‚offen‘), wo es hervorgehoben werden soll. Entsprechend ist das 
Merkmal selbst nur im Ausnahmefall in Kapitälchen-Schrift markiert, z.B. das Merkmal Hoch. 

5Die später verwendete Bezeichnung ‚hochdeutsche Kardinalvokale‘ bezieht sich auf die ent- 
sprechenden hochdeutschen Ausprägungen bzw. Realisationen. 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


24 Phonetik, Phonologie und der VokalJäger 


nach der Lippenrundung eigentlich irrelevant, doch die IPA-Konvention setzt die 
Rundung als ‚ungerundet‘ an (not round): „And if a vowel is produced in which 
the highest point of the tongue is at the front of the mouth and the mouth is as 
open as possible, the result is a“ (IPA 1999, 11) und: „Near to the French sound of 
ain la. Used by many Northern English people in words like grass, chance“ (Jones 
1956, 14). Ein weiterer Extremvokal ist das im Hochdeutschen nicht vorhandene 
[a] (Kardinalvokal Nr. 5)°. Hier ist die Lage der Zunge maximal hinten und die 
Öffnungsstufe ist maximal offen: „The space between the tongue and the roof of 
the mouth is as large as possible, so this vowel is described as ’open’, and the 
tongue is near the back of the mouth, so it is described as "back”* (IPA 1999, 11). 
Bei Jones (1956, 14): „The most ’retracted’ kind of a-sound. Near to the French 
sound of ain pas“. Der letzte Extremvokal ist das [u] (Kardinalvokal Nr. 8). Hier 
liegt die minimale Öffnungsstufe ‚geschlossen‘ (closed), die maximale Rückziehung 
der Zunge auf die Lage ‚hinten‘ (back) und die maximale Rundung der Lippen 
(round) vor. 


„If the tongue body is raised as close as possible at the back of the mouth [...| and (as is 
common in languages) the lips are simuntaneously rounded and protruded, the close back 
vowel u results“ (TPA 1999, 11). 


Dazu merkt Jones (1956, 14) an: „Near to the German sound of win gut“. Das [u] 
liegt im Vokalinventar aus Abbildung 3 auf S. 22 rechts oben. Damit steht es dem 
[a], welches links unten verortet ist, maximal gegenüber. Alle Eigenschaften sind 
invertiert. 

Die weiteren primären Kardinalvokale 2, 3, 6 und 7 ergeben sich in Bezug auf 
die vier Extremvokale [i/a/a/u]. Zunächst definiert die IPA zwei intermediäre Öff- 
nungsstufen zwischen ‚offen‘ und ‚geschlossen‘. Der Öffnungsstufe ‚halboffen‘ (open 
mid) werden die Kardinalvokale Nr. 2, [e], und Nr. 3, [5], normativ zugewiesen. Auf 
der Öffnungsstufe ‚halbgeschlossen‘ (close mid) folgen Kardinalvokal Nr. 6, [e], und 
Nr. 7, [o]. Dabei sind [e] und [e] mit der Lage ‚vorne‘ definiert und weisen die Run- 
dung ‚ungerundet‘ auf. Entsprechend invertiert sind [5] und [o] bezüglich der Lage 
als ‚hinten‘ definiert und weisen Rundung auf. Diese Aufteilung ist mit IPA (1999, 
11-12) mehr auditorisch als artikulatorisch äquidistant definiert: 


„[-..] so that the differences between each vowel and the next in the series are auditorily 
equal; [...] The use of auditory spacing in the definition of these vowels is not based purely on 
articulation, and is one reason why the vowel quadrilateral must be regarded as an abstraction 
and not a direct mapping of tongue position.“ 


Bei Jones (1956, 14) finden sich Beispiele: 


„[e]: Near the French sound of e in the; [e]: Near the French sound of & in meme; [5]: Near 
the German sound of o in Sonne; [o]: Near the vowel sound in home as generally pronounced 
in Scottish English.“ 


6Vgl. Abschnitt 2.3.2 ab $.31 mit Anmerkungen zu [a] als Allophon im Deutschen. Das 
Lautzeichen [a] wird später im Text zur Markierung des dunklen A-Lauts im Frankfurterischen 
verwendet werden (vgl. Abschnitt 9.4.1.1 ab S.307). 
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Kohler (1999, 87) ergänzt mit lautlich nahen Beispielen aus dem Hochdeutschen: 
[er]: beten; [e]: (die) Betten; [o:] (sie) boten; [>]: Botten (Schuhe). 

Die sekundären Kardinalvokale 9 bis 16 ergeben sich aus normativer Inversion 
der Eigenschaft Rundung. Die runden Vokale mit der Lage ‚vorne‘ sind (mit zuneh- 
mender Öffnungsstufe) Nr.9, [y]; Nr. 10, [6] und Nr. 11, []. Jones (1956, 14-15) 
erläutert: 


„[y]: Near the French sound of win lune. The cardinal sound is, however, more :-like in quality 
than this French sound. The sound of the yin the Norwegian word ny is nearer to Cardinal 
y than the French sound is; [6]: Near to the French sound of eu in peu, but somewhat more 
e-like in quality; [oe]: Near to the French sound of eu in peur, but somewhat more e-like in 
quality.“ 


Für das Hochdeutsche führt Kohler (1999, 87) lautlich nahe Beispiele an: [y:] hü- 
ten; [v] Hütten; [or] Goethe; [e] Götter‘. Der Kardinalvokal Nr. 12 [«] stellt eine 
interessante Ausnahme dar: Er ist rein hypothetisch. Maddieson (1984, 124) fin- 
det keine Sprache der Welt, in der [&] vorkommt. Jones (1956, 15) beschreibt [«] 
so: „Made by trying to sound Cardinal a with simultaneous ’open’ lip rounding. 
This cardinal sound is not known to occur in any language“. Entsprechend gibt 
es die hinteren ungerundeten Kardinalvokale 13 bis 15 [wr/x/Aa] (mit zunehmender 
Öffnungsstufe). Die Reihe wird ergänzt durch Nummer 16, das hintere und runde 
[op]. Alle kommen im Hochdeutschen nicht vor. [u/Y] entstehen aus [o/u] durch 
Ersetzen der Lippenrundung durch Lippenspreizung. Im Gälischen werden sie des- 
wegen von Bauer (2011, 58, 66) als „grinning O“ und „grinning U“ bezeichnet. Zu 
den beiden anderen merkt Jones (1956, 14-15) an: 


„[A]: The sound arrived at by "unrounding? 5. It is comparable to a very ’retracted’ variety 
of the English sound of win cup; [no]: Near to the Southern English sound of o in hot.“ 


Die weiteren vorderen Vokale [ı/v/z] werden auf intermediären Öffnungsstufen 
eingefügt. 

Abschließend definiert die IPA Zentralvokale (central vowels), bei denen die 
Lage der Zunge eine zentrale Position einnimmt. Deren Lage ist auditorisch und 
artikulatorisch zwischen vorderen und hinteren Vokalen. Auf der größten Öffnungs- 
stufe ‚offen‘ sieht die IPA keine Zentralvokale vor, wohl aber auf den geschlossene- 
ren Öffnungsstufen (zum [a] als Zentralvokal des Deutschen, vgl. Abschnitt 2.3.2 ab 
S.31). Die Zentralvokale kommen jeweils gepaart rund und ungerundet. Die Serie 
der runden Zentralvokale wird von [u/e/s] gebildet (jeweils mit den Öffnungs- 
stufen der runden hinteren primären Kardinalvokale [u/o/>], von denen auch die 
Lautzeichen entlehnt sind). Die Serie der ungerundeten Zentralvokale ist [3/9/3] 
(die Öffnungsstufen und Lautzeichen folgen hier entsprechend den ungerundeten 
vorderen primären Kardinalvokalen [i/e/e]). All diese Zentralvokale kommen im 


”An dieser Stelle sei angemerkt, dass die Tonaufnahmen von Daniel Jones (vgl. Abschnitt 
4.1.3 ab S.113) sich für [y/e] sowohl vom Höreindruck her als auch messphonetisch weder mit 
den deutschen noch den französischen [y/o] zu decken scheinen (vgl. hierzu Abschnitt 4.6.2 ab 
S.154). 
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Hochdeutschen nicht vor, wohl aber in den deutschen Dialekten (vgl. auch Ab- 
schnitt 2.3.4). So hat das Obersächsische Tendenzen zur Zentralisierung und man 
findet anstatt [u] zentralisiertes und gesenktes [e], z. B. [fled] Flut. Ähnlich [s] für 
[0] in [nset] Not und [5] für [r] in [-lof] -Kch (Rues u.a. 2007, 94). Auf der Ebene 
zwischen den Öffnungsstufen ‚offen‘ und ‚halboffen‘ verortet die IPA das zentrale 
A-Schwa [e], das nur unbetont vorkommt. Das zentrale eigentliche Schwa [o] wird 
auf eine Öffnungsstufe zwischen ‚halbgeschlossen‘ und ‚halboffen‘ gesetzt. 


2.2.2 Problematik des Referenzsystems und Lautsymbols 


Wie schon in den vorherigen Abschnitten angemerkt, ist das IPA-Vokalinventar 
ein idealisiertes und artifizielles Inventar. Die dort angesetzten extremen Ausprä- 
gungen sind so in kaum einer Sprache oder einem Dialekt vorhanden (IPA ent- 
hält sogar den Laut [«], der in keiner einzigen realen Sprache vorkommt). Damit 
stellt sich zum einen die Frage, welches Lautsymbol klassifikationsphonetisch ge- 
wählt wird, um einen Laut bzw. die zugrundeliegende Artikulationsspezifikation 
zu beschreiben. Liegt in einem Vokalsystem kein Konflikt vor, wählt man oft den 
nächstliegenden Kardinalvokal als Symbol bzw. jenen Kardinalvokal, dessen Ex- 
tremspezifikation am ehesten passt. 

Folglich entsteht nun das Problem, dass in zwei verschiedenen Sprachen bzw. 
Dialekten zwei verschiedene Laute (im Sinne von Artikulationsspezifikationen) mit 
ein und demselben klassifikationsphonetischen Lautsymbol versehen sein können. 
So wird z.B. das lange I im Niederländischen leicht weniger vorne gesprochen als 
im Hochdeutschen, wo es dem Kardinalvokal [i] sehr nahe ist, doch in Publikatio- 
nen findet sich üblicherweise für jede der beiden Sprachen das identische Symbol 
fi!) (IPA 1999, 76 und 87). Waren es in genanntem Beispiel nur Feinheiten, tre- 
ten mehr Probleme auf, wenn sich die Systeme fundamental unterscheiden. Hat 
das eine System z.B. nur drei Öffnungsstufen, muss das Symbol für die mittle- 
re Stufe entweder aus der halboffenen oder aus der halbgeschlossenen Stufe des 
vierstufigen IPA-Referenzsystems gewählt werden. So wird der mit [e] markierte 
Laut des Spanischen deutlich offener als die im Französischen, Englischen oder 
Deutschen ebenso mit [e] klassifizierten Laute gesprochen, was seinen Grund in 
der Dreistufigkeit des spanischen Vokalsystems hat usw. (Delattre 1965, 49). 

Was tun? Man muss eines der Systeme zur Referenz erklären und die anderen 
dagegen verorten. Wie schon erwähnt, soll für den VOKALJÄGER das hochdeut- 
sche Lautsystem die Referenz sein. Somit beziehen sich alle klassifikationsphone- 
tischen Lautsymbole auf das Hochdeutsche (vgl. Abschnitt 2.3.1 ab S.30). Die 
Definition erfolgt allerdings nicht explizit qualitativ über Spezifikationen. Vielmehr 
erfolgt die Definition implizit quantitativ durch einen umfangreichen Datensatz von 
Sprachproben, auf den der VOKALJÄGER ‚trainiert‘ wurde. Genutzt wird hier das 
Kiel-Korpus, für das eine phonematische Transkription in den Daten vorliegt (vgl. 
Abschnitt 4.1.2 ab S. 113). Praktischerweise ist das hochdeutsche Lautsystem dem 
IPA-System nahe, aber deutsche Dialekte weichen ab (vgl. Abschnitt 2.3 ab S. 30). 
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Eine andere Option für ein Referenzsystem wären die extremen Kardinalvokale von 
Daniel Jones gewesen. Doch gibt es hier nur eingeschränktes Referenztonmaterial, 
so dass es sich als belastbare Datenbasis für einen quantitativen und indirekten 
Ansatz wenig eignet. 


Hat man einmal das klassifikationsphonetische Referenzsystem definiert, kann 
man Abweichungen dazu bzw. Variationen darüber definieren. Die IPA führt dazu 
Diakritika ein, die kleinere Abweichungen vom Referenzvokal codieren. Wichtig ist 
die Annahme, dass die Änderung ceteris paribus erfolgt: Alle anderen Eigenschaf- 
ten bleiben unverändert. So ist z. B. ein gesenktes [i] genauso weit vorne gesprochen 
wie ein [i]l. Damit unterscheidet es sich (noch) von einem [r], welches sowohl ge- 
senkt als auch zurückgezogen ist. Die Grenzen sind fließend. Ob man z.B. [e] oder 
[i] schreibt, also [e] oder [i] als Bezug ansetzt, wird oft historisch-phonologisch 
bestimmt. 


2.2.3 Vokalische Merkmale 


Welche der möglichen Laute kommen in einer Sprache oder einem Dialekt vor? 
Welche Bedingungen müssen sie erfüllen? Die notwendige Bedingung ist, dass die 
Laute genügend unterschiedlich klingen, um als bedeutungsunterscheidend wahr- 
genommen zu werden. Dazu müssen die Laute in prägnanten Merkmalen variieren. 
Sind diese Merkmale, features, einmal gefunden, definieren sie das eigentliche pho- 
nologische Ordnungsmuster der Sprache oder des Dialekts. Das Grundmuster der 
Merkmale wurde mit den Ordnungseigenschaften des IPA-Vokalinventars in Ab- 
schnitt 2.2.1, S. 20f., eingeführt: dies sind die artikulatorisch motivierten Merkma- 
le Öffnungsgrad, Rundung und Zungenlage. Dazu können bei Bedarf noch weitere 
kommen: die Vokaldauer, die Nasalierung usw. 


So ist die erste Frage: Welche Merkmale, welche Basisvokale, welche Phoneme 
hat eine Sprache oder ein Dialekt? Mit welchen Merkmalen kann die Sprache oder 
der Dialekt vollumfänglich beschrieben werden? Ist die strenge Anwendung bi- 
närer Merkmale nach Chomsky/Halle (1991) notwendig oder sinnvoll? Die zweite 
Frage ist: Was für eine lautliche Verortung weisen diese Phoneme gegenüber den 
idealisierten Kardinalvokalen der IPA auf? 


Welches sind nun die bestimmenden und prägnanten Merkmale? Am Anfang 
steht die Analyse der real existierenden Vokalsysteme über Sprachen und Dialekte 
hinweg mit dem Ziel, übergreifende Muster zu bestimmen. Komparative Studien zu 
den phonemischen Vokalsystemen der Welt finden sich vollumfänglich in Crothers 
(1978) und Maddieson (1984, 263-422) und in Auswahl in Trubetzkoy (1958, 80- 
114) sowie Liljencrants/Lindblom (1972, 845-852). Die Frage nach den wahrlich 
universellen Merkmalen bleibt jedoch offen: „the correct set of features remains to 
be established“ (Liljencrants/Lindblom 1972, 858). 
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2.2.4 Öffnungsstufe als Merkmal 


IPA (1999) weist für den Öffnungsgrad zwischen Zunge und Gaumen ein vierstufi- 
ges System mit den Ausprägungen close, mid close, mid open und open aus, wobei 
auch Zwischenstufen möglich sind, z.B. near close oder near open. Die UCLA 
Phonological Segment Inventory Database (UPSID) hingegen wählt zur globalen 
Sprachcodierung fünf Abstufungen mit high, higher mid, mid, lower mid und low 
(Maddieson 1984, 167). Doch nicht jede Sprache schöpft die volle Zahl von Öff- 
nungsstufen aus. Abhängig von der Anzahl reichen möglicherweise weniger Öff- 
nungsstufenbezogene Merkmale zur phonetisch-phonemischen Codierung aus, was 
an folgenden Beispielen erläutert werden soll: 


Öffnungsstufe Eskimo Farsi Bulgarisch 
1 i u i u i u 
2 e 0 Y 
3 € s) 
4 a a a a 


Crothers (1978, 104 und 138) findet z. B. weltweit 23 Vokalsysteme (von 209), die 
nur drei Vokale kennen, wie z.B. aleutisches Eskimo. Hier reicht zur Codierung 
der Öffnungsstufe ein binäres Merkmal HochH vollständig aus. Farsi hingegen hat 
z.B. mit sechs Vokalen drei Öffnungsstufen und Bulgarisch weist mit ebenso sechs 
Vokalen vier Öffnungsstufen auf (Maddieson 1984, 266 und 268). Wenn die Öff- 
nungsstufe streng binär codiert werden soll, müssen hier zwei binäre Merkmale 
angesetzt werden, etwa HOCH und TIEF. Doch hier zeigt sich ein Problem der bi- 
nären Codierung: Im Fall von Farsi übercodieren zwei binäre Merkmale mit ihren 
vier möglichen Ausprägungen die nur drei vorhandenen Öffnungsstufen. Im Fall 
von Rumänisch erscheint es kompliziert, die vier Öffnungsgrade jeweils doppelt- 
binär zu codieren als ‚hoch + nicht-tief‘, ‚nicht-hoch + nicht-tief‘, ‚hoch + tief‘ 
und ‚nicht-hoch + tief‘. 

Im VOKALJÄGER wird hingegen eine numerische Darstellung für das Merkmal 
Öffnungsstufe verwendet. Dieses Merkmal soll, an die IPA angelehnt, vier nume- 
rische Wertausprägungen annehmen, die von 1 (geschlossen) bis 4 (offen) reichen. 
Die heutige moderne Marburger Methode ist äquivalent, da hier explizit auf die 
vier Öffnungsstufen der IPA referenziert wird (Herrgen u.a. [2001, 2] und Lameli 
[2004, 67]). Die Marburger Terminologie ist die der Öffnungsstufe, die hier auch 
verwendet wird. Bei Haas (1978, 304) findet sich ein ähnlicher Vorschlag für eine 
numerisch fünfstufige Codierung des Luzerndeutschen - allerdings mit invertier- 
ter Zählung, da hier das Merkmal in der Deutung „Höhendimension“ der Zunge 
angesetzt wird. Für Haas stellte dies eine praktische alternative Formulierungs- 
möglichkeit dar, welche von der damals vorherrschenden Darstellung mit streng 
binären Merkmalen abwich: „Es wäre durchaus möglich, auch unsere Senkungen 
mit Hilfe einer derartigen Regel, die über einer skalaren Höhendimension arbeitet, 
einheitlich zu formulieren“ (Haas 1978, 328). 
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2.2.5 Zungenlage als Merkmal 


Nach IPA (1999) gibt es drei Ausprägungen der Eigenschaft der Zungenlage: front, 
central und back. Die UPSID folgt dieser Terminologie exakt (Maddieson 1984, 
167). Wiederum stellt man fest, dass nicht alle Sprachen die volle Ausprägung 
haben: Im Griechischen findet man nur einen Kontrast zwischen vorne, [i] bzw. 
[€], und hinten, [u] bzw. [>]: 


(Maddieson 1984, 167). Hier reicht eine binäre Codierung wie VORNE vollumfäng- 
lich aus. Anders ist die Situation in Sprachen mit Zentralvokalen, wie z.B. bei den 
kurdischen Kurzvokalen: 


9 


(Maddieson 1984, 269). Hier bedarf es einer Lagecodierung mit drei Ausprägungen. 
Zwei binäre Merkmale, etwa VORNE plus ZENTRAL, übercodieren jedoch: ‚vorne 
+ nicht-zentral‘, ‚nicht-vorne + zentral‘ und ‚nicht-vorne + nicht-zentral‘, wobei 
die theoretisch mögliche Kombination ‚vorne + zentral‘ ungenutzt verbleibt. 

Im VOKALJÄGER wird deswegen ein ordinales Merkmal verwendet: Der Mar- 
burger Terminologie folgend wird es als Lage bezeichnet und hat, der IPA (1999) 
gleich, die Ausprägungen ‚vorne‘, ‚zentral‘ und ‚hinten‘. 


2.2.6 Lippenrundung als Merkmal 


Sowohl IPA (1999) als auch die UPSID setzen die Lippenrundung als ein binäres 
Merkmal an (Maddieson 1984, 167). Dem folgt der VOKALJÄGER. So kommen z.B. 
nach Maddieson (1984, 267) die vorderen Kurzvokale des Französischen jeweils in 
einer ungerundeten (linkes Lautzeichen) und einer runden Version vor (rechtes 
Lautzeichen): 


Die Lippenrundung ist ein unkritisches binäres Merkmal und wird im VOKALJÄ- 
GER unter der Bezeichnung Rundung geführt. 


Die Merkmale Rundung und Lage werden in der Marburger Terminologie mit 
Herrgen u.a. (2001, 2) als Klassen bezeichnet. 
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2.3.1 Hochdeutsch 


Das Hochdeutsche kennt nur eine eingeschränkte Auswahl aus dem IPA-Vokalin- 
ventar des Abschnitts 2.2.1, S.20f. (Maddieson [1984, 265], Russ [1994, 121-153], 
Kohler [1995], Kohler [1999, 87] und Rues u.a. [2007]). Die Regeln der genormten 
Aussprache und der Bühnenaussprache finden sich in Siebs (1912), Mangold (2005) 
und Siebs (2000). Die deutschen Vokale sind in Tabelle 2 auf S.21 markiert. Dar- 
aus ergibt sich das reduzierte hochdeutsche Vokalinventar in Tabelle 4 auf S. 31, in 
dem auch die Ausprägungen der Merkmale der Öffnungsstufe, Lage und Rundung 
angegeben sind. 
Die als Referenz angesetzten hochdeutschen Langvokale sind: 


ı yı u! 


Durch das Alleinestehen des [a] auf der größten Öffnungsstufe wird das IPA-Vo- 
kalviereck zu einem hochdeutschen Vokaldreieck. Man erkennt, dass das Inventar 
der Langvokale vier Öffnungsstufen aufweist. 

Die Kurzvokale des Hochdeutschen sind dreistufig, wenn man die unbetonten 
Schwavokale [o] und [e] nicht mitzählt: 


I Y Ü 


Der Lautklang der Langvokale ist in der Regel unterschiedlich von dem der Kurz- 
vokale, was sich in der fast durchgehenden Verwendung verschiedener IPA-Laut- 
zeichen für lang und kurz anzeigt. Die erste Ausnahme ist das A, welches im 
Langvokalsystem mit [a:] denselben Lautwert wie im Kurzvokalsystem mit [a] auf- 
weist. Die zweite Ausnahme ist das offene E, welches ebenfalls als kurzes [e] und 
als langes [e:] in beiden Systemen vorkommt. 

Das Hochdeutsche kennt Rundung mit den gerundeten Vorderzungenvokalen 
[y:]l, DW], [er] und [ce]. Bis auf die Schwavokale [o] und [e] hat das Hochdeutsche 
keine Zentralvokale (wenn man das alleinstehende [a] einmal ausblendet) und die 
Lage ist hauptsächlich durch einen vorne/hinten-Kontrast definiert. 

Die Diphthonge des Hochdeutschen sind [aı/au/ov], wobei die zweite Kompo- 
nente immer unsilbisch ungespannt bzw. unbetont ist?. 


8Die lautliche Beschreibung der hochdeutschen Diphthonge ist vielfältig. Die kanonische Du- 
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Ö vorne zentral hinten 
r r r 
geschlossen 10 ı y u 
1,5 I Y U 
halbgeschlossen 20 eu © 0) 
2,9 $) 
halboffen 30 e/ı ®) 
3,9 e 
offen 4,0 a/a: 


Tabelle 4: IPA-Vokalinventar der hochdeutschen Standardvokale. [e/a] kann sowohl 
lang, [e:/a:], als auch kurz, [e/a], vorkommen. Den für das Hochdeutsche üblichen 


Konventionen folgend ist das [a] als ein Zentralvokal eingetragen (Ö: Öffnungsstufe; 
r: runder Vokal). 


Kombiniert man die monophthongischen Kurz- und Langvokale, ergibt sich für das 
Hochdeutsche die folgende Darstellung: 


iv y u 
I Y Ü 
er gi 0 
9 
e/eı © 5) 
® 
a/aı 


Wenn man die hochdeutschen Langvokale normativ als Bezugspunkte wählt, er- 
geben sich vier Öffnungsstufen zwischen der Stufe der geschlossenen [ir/yr/u:] und 
den offenen [a/a:]. Die Kurzvokale sortieren sich entsprechend auf Zwischenstufen, 
wie in Tabelle 4 aufgeführt. 


2.3.2 Zum deutschen A 


Im genormten Hochdeutschen wird kein qualitativer Unterschied zwischen langem 
[fa:] und kurzem [a] angesetzt (Kohler [1999], Kohler [1995, 170], Kohler [1999, 
87] und Mangold [2005, 35]). Dieser Gleichklang des A wurde von Theodor Siebs 
Anfang des 20. Jahrhunderts für die Deutsche Bühnenaussprache normativ festge- 
legt: 


den-Form nach Mangold (2005, 36) ist [ai/äu/5y], aber auch da wird ergänzt: „phonetisch genauer 
wäre die Schreibung [aı/au/sy]“. Letzterer wird auch hier gefolgt, wobei die unsilbische Markie- 
rung unterbleibt. Andere Transkriptionen finden sich etwa bei Kohler (1995, 169) mit [ar/av/ar] 
und Rues u.a. (2007, 18) mit [ae/ao/59]. Für die Berechnung von Dialektalität setzten Herrgen 
u.a. (2001, 3) die Varianten [a1/ä9], [a0] und [5t/5e/55/5v] als gleichwertig gültige Repräsentanten 
des Hochdeutschen an. 
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„Der qualitative Unterschied des kurzen a und des langen a ist in der gesprochenen Sprache 
der Bühne äußerst gering und kaum der Beachtung wert: das kurze a wird zumeist etwas 
offener (weniger gespannt), das lange a ein wenig geschlossener (gespannter) gesprochen |...]. 
Die a-Laute sind als sogenanntes mittleres a zu sprechen, weder zu dumpf noch zu hell, d.h. 
sie dürfen sich weder den o-Lauten nähern, (wie in sehr vielen Mundarten, namentlich ober- 
deutschen), noch den ä-Lauten, (wie in verschiedenen nordwestdeutschen Mundarten), noch 
auch den offenen ö-Lauten (wie man es z.B. in Hannover und in Braunschweig hört). Folgt 
dem a ein m oder n, so darf der Vokal nicht nasaliert klingen (wie es z.B. im Zentralhessi- 
schen, Schwäbischen und in österreichischen Mundarten vorkommt), sondern in Kan (Kahn) 
ist das a genauso zu sprechen wie in kal (kahl), in kan (kann) wie in kalt usw.“ (Siebs 1912, 
35-36). 


Bezüglich der Eigenschaften des hochdeutschen [a] gibt es Abweichungen von der 
Norm der IPA. Nach IPA (1999) ist der primäre Kardinalvokal Nr. 4 [a] ein Vorder- 
vokal, der auf der Stufe mit der höchsten Öffnungsstufe im Kontrast zum fünften 
Kardinalvokal [a], einem hinteren Vokal, steht. Beschreibungen des Deutschen set- 
zen hingegen das [a] als einen Zentralvokal an, der alleiniger Vertreter auf der Stufe 
mit dem höchsten Öffnungsgrad ist (Heike 1981, 25). Das liegt darin begründet, 
dass das Hochdeutsche den fünften Kardinalvokal [a] als Phonem nicht kennt. Ent- 
sprechend gibt es auch keinen vorne/hinten Kontrast auf der höchsten Öffnungs- 
stufe. In enger IPA-Notation, streng ausgerichtet an der IPA-Normkonstellation 
[a/a], entspricht das deutsche A entweder einem rückgezogenen [a] oder einem 
vorgeschobenen [a]. Die weite Transkription ist aber durchweg ohne Diakritikum 
einfaches [a] (Rues u.a. 2007, 8). In ein IPA-Vokalviereck wird das hochdeutsche 
[al in der Mitte zwischen IPA-[a] und IPA-[a] an der Position der Zentralvokale 
eingetragen (Kohler 1999, 87). Im messphonetischen Vergleich mit den Kardinal- 
vokalen bestätigt sich die Zentralisierung im VOKALJÄGER (vgl. Abschnitt 4.6.3 
ab S. 157). 

Nun ist es aber nicht so, dass das Deutsche den Laut des dunklen bzw. velaren 
[a] neben dem des [a] überhaupt nicht kennt (obwohl dieses ‚verdunkelte‘ A bei 
weitem nicht so weit hinten artikuliert wird wie ein extremes [a] nach Daniel Jones; 
ebenso ist es nicht so dunkel wie im Frankfurterischen). Im Hochdeutschen ist das 
[a] zwar kein Phonem, kann aber in nicht genormter Sprache als Allophon auftre- 
ten. Kohler (1995, 166) gibt Beispiele für eine allophonische Variation von [a] zu 
[a], wie sie vor den Liquiden R und L auftreten kann: Haar wird bei ihm mit [a:] 
angesetzt; Wirrwarr hat kurzes [a]; Karl wird zu [k"at] aber kahl bleibt [kPa:P]. 
Die Darstellung ist aber nicht einheitlich. Rues u. a. (2007, 71) transkribieren stan- 
dardsprachliches kurzes A vor vokalisiertem oder elidiertem R eng als erhaltenes 
[a]: hart ist [hat] oder [hart]. Strange/Bohn (1998, 490) setzen das lange A mit 
[a:] sowie das kurze mit [a] an und zählen beide als unterschiedliche Monophthonge 
des Hochdeutschen. In den deutschen Dialekten kann ein dunkles A eine wichtige 
Rolle spielen. Dieses dunkle A wird in Teuthonista mit (ä) gesetzt und entspricht 
in etwa einem vorgeschobenen IPA-[a] oder [5]. Es bietet sich hier insbesondere 
für das Frankfurterische ein einfaches Setzen mit [a] an (vgl. Abschnitt 2.3.4 ab 
S.33 und 7.5.3 ab S. 268). 
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Das hochdeutsche System ist phonemisch ein Dreieckssystem, denn es hat mit 
[a] nur genau ein Phonem auf der höchsten Öffnungsstufe. Aber klassifikationspho- 
netisch und messphonetisch hat es durchaus statistischen Viereckscharakter. Dies 
ergibt sich aus den -— wenn auch nur leichten — Variationen zwischen den Lauten 
[al und [a:] (vgl. Abschnitt 4.6.3 ab S. 157 zu messphonetischen Ergebnissen zum 
hochdeutschen A). 


2.3.3 Zu den deutschen E-Lauten 


Wie viele E-Laute hat das Hochdeutsche? Der Blick in das IPA Inventar in Tabelle 
4 auf S.31 suggeriert drei: [er/e:/e]. Während der Unterschied zwischen [e:] und 
[e] allgemein anerkannt ist, nimmt [er] eine Sonderrolle ein. [e] ist neben [a/a:] der 
einzige Vokal, der mit gleicher Qualität, aber unterschiedlicher Quantität gesetzt 
wird: [e/er]. Der Laut [e:] stört die phonemische Symmetrie nicht-zentraler Vokale 
im Hochdeutschen. 

Auch ist die phonetische Realisierung des Phonems /e:/ regional erheblich un- 
terschiedlich. Kohler (1995, 173) bemerkt, dass der lautliche Unterschied zwischen 
/e:/ und /e:/, vor allem im Norddeutschen, zugunsten von [e:] „aufgegeben“ ist. 
Sanders (1972) fragte, ob denn /e:/ ein „ghostphonem“ sei und konkludiert, dass 
man phonologisch von einem „Sozio-Archiphonem“ /E/ sprechen sollte, dem sich 
/e:/ und /e:/ unterordnen. Die normativen Ausspracheregeln des Hochdeutschen 
hingegen bestehen auf einer dediziert offenen [e:]-Lautung für das Schriftzeichen 
(ä) (Mangold [2005, 71] und Siebs [2000, 58]). 

In der messphonetischen Untersuchung Pätzold/Simpson (1997, 221) des hoch- 
deutschen Kiel-Korpus, das auch im VOKALJÄGER verwendet wird, entschließen 
sich die Autoren, die mit [er] phonematisch markierten Laute auszuschließen, auch 
aufgrund des „dubious status in Standard German“. Die Problematik der laut- 
lichen Verortung von [e:] wird sich in den Messergebnissen des VOKALJÄGERS 
widerspiegeln (vgl. insbesondere Text zu Abbildung 66 auf S. 163). 


2.3.4 Deutsche Dialekte 


Wesentlich vielfältiger sind die Vokalsysteme der deutschen Dialekte. Hier sol- 
len nur exemplarisch einige Fundamentalunterschiede zum Hochdeutschen erwähnt 
werden; Einzelheiten finden sich z.B. in Wiesinger (1983b). Zwar ist das hochdeut- 
sche Langvokalsystem vierstufig, doch weichen die deutschen Dialekte vereinzelt 
davon ab. So ist z.B. das mittelalemanische Langvokalsystem aus Dornbirn im 
Voralberger Rheintal fünfstufig: 


IE 3 Ur 
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(Wiesinger 1983b, 1051). Manche Dialekte sind entrundet. Entrundeten Systemen 
wie dem vierstufigen südmittelbayerischen Kurzvokalsystem aus Großarl im Salz- 
burger Pongau fehlen die runden kurzen hochdeutschen Vorderzungenvokale [v] 
und [ce]: 


(Wiesinger 1983b, 1054). Besonders interessant für den VOKALJÄGER sind Dialek- 
te, die das Inventar der hochdeutschen Vokale erweitern. Dazu gehören die ostmit- 
teldeutschen Dialekte. Das thüringische Kurzvokalsystem aus Gleichen bei Erfurt 
ist in seiner Symmetrie gestört: 


1 wu 


(Wiesinger 1983b, 1060). Das dunkle A, [a], fügt eine Zwischenstufe zwischen [e] 
und [a] ein (hier wurde [a] für in der klassischen Teuthonista-Lautschrift bezeich- 
netes (ä) gesetzt; siehe auch Abschnitt 7.5.3). Zum anderen ist rundes hinteres [u] 
nicht vorhanden und durch ein ungerundetes [ur] ersetzt. Sowohl [a] als auch [ur] 
kommen im hochdeutschen Lautinventar nicht vor. In obersächsischen Vokalsyste- 
men taucht ein zentralisiertes ungerundetes [e] anstatt des üblichen [v] auf: 


Auch das [e] ist dem Hochdeutschen fremd (zu Krieschendorf bei Dresden vgl. 
Wiesinger [1983b, 1060] und Rues u.a. [2007, 94] zu Laubegast bei Dresden). 
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Kapitel 3 


Algorithmische Messphonetik 


Zusammenfassung: Die für den VOKALJÄGER entwickelte robuste Messpho- 
netik ist die erste Säule der vorliegenden Arbeit. Dieses Kapitel führt die 
messphonetischen Begriffe und Methoden ein, welche im VOKALJÄGER zur 
Anwendung kommen. Der Schwerpunkt liegt auf Algorithmen zur hochgradig 
automatisierten phonetischen Auswertung digitaler Sprachdaten, was hier als 
algorithmische Messphonetik bezeichnet werden soll. Das Kapitel beschreibt 
sowohl die üblichen messphonetischen Größen (wie die Formanten) als auch 
die Verfahren, die zu ihrer Messung entwickelt wurden. Bei der Darstellung 
wurde Wert darauf gelegt, die einzelnen Schritte und Verfahren mit dem In- 
strumentarium des VOKALJÄGERSs nachzuvollziehen und zu dokumentieren. 


Es werden neue Varianten vorgestellt, die sowohl robust gegenüber Mess- 
fehlern als auch gegenüber systematischen Unterschieden zwischen Vokalsys- 
temen sind. Damit eignen sie sich besonders für die Verarbeitung alter Tonauf- 
nahmen über nicht normierte Sprachkorpora hinweg. Im Einzelnen ist dies ein 
Algorithmus zur Bestimmung der optimalen Formantbahn (Abschnitt 3.3.4 
ab $S.64), ein Mechanismus zur robusten Sprechernormalisierung (Abschnitt 
3.6.7 ab S.91) und die Methode der Rückfaltung zur Erkennung und Korrek- 
tur von Ausreißern (Abschnitt 3.6.9 ab S. 93). Damit ist ein vollautomatisches 
Analysieren von vorsegmentierten Lautsignalen in einer Prozesskette möglich 
(Abschnitt 3.7 ab $.103). 
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3.1 Akustische Größen 


Das vorliegende Kapitel erläutert die für den VOKALJÄGER wesentlichen Konzepte 
der Signaltechnik und Messphonetik, wobei der Fokus auf letzterem und der Nutz- 
anwendung liegt. Zu den Grundlagen zur zeitdiskreten und digitalen Signalverar- 
beitung sei auf die Fachliteratur verwiesen (Rabiner/Schafer [1978], Oppenheim / 
Schafer [1992] und Deller u.a. [1992]). 


3.1.1 Lautschallsignal, Lautsignal, Lautsegment und Fenster 


Das prinzipielle Vorgehen zur Errechnung akustischer Größen ist in Abbildung 
4 auf S.37 beschrieben: Der im Sprechakt erzeugte physikalische Lautschall, eine 
Luftdruckwelle, wird in seiner Form als digitaler Datensatz hier Lautschallsignal ge- 
nannt. Das Lautschallsignal ist ein zeitdiskretes digitales Signal bzw. eine Zeitreihe 
von Werten und steht am Anfang der Verarbeitungskette des VOKALJÄGERS. 

Aus dem Lautschallsignal wird eine Folge von äquidistanten Ausschnitten — 
die Zeitfenster (frames) — extrahiert. Ein Zeitfenster repräsentiert einen kleinen 
Teil des Lautschallsignals, von dem angenommen wird, dass er im Wesentlichen 
artikulatorisch und auditorisch homogen ist. Die Zeitfenster sind überlappend und 
gegeneinander um kleine Zeitschritte verschoben. Üblicherweise werden dabei Aus- 
schnitte einer Länge von etwa 25 ms aus dem Signal in kleinen Schritten von z.B. 
2 ms entnommen. Bei einer Länge von 25 ms und einer Abtastrate von 10 kHz ent- 
hält das Zeitfenster 250 Messpunkte des Lautschallsignals. Die Zeitfenster werden 
dabei, um Randeffekte zu vermeiden und um dem Zentrum ein klares Gewicht zu 
geben, an den Seiten mit einer übergelagerten Fensterfunktion abgedämpft, was 
in Abbildung 5 auf S.38 dargestellt ist. Dabei kommen verschiedene Fensterfunk- 
tionen zum Einsatz, wie z.B. das klassische Hamming-Fenster (Deller u.a. 1992, 
16), oder das modernere Gauß-Fenster (Boersma 1993, 110). Der VOKALJÄGER 
nutzt Zeitfenster mit einer Länge von 25 ms, eine Gauß-Fensterfunktion und 2 ms 
Versatz?. Auf dem extrahierten Ausschnitt des Lautschallsignals wird mittels ei- 
ner messphonetischen Analysefunktion signaltechnisch ein Messwert bestimmt. Die 
Folge der Messwerte bildet dann ein Lautsignal. Das Lautsignal ist selbst wieder 
eine Funktion der Zeit bzw. eine Zeitreihe von Werten. Eignet sich das Lautsignal 
für eine mathematische Klassifikation, ist es als akustische Größe bezeichnet (vgl. 
Abschnitt 3.1.2 ab $.38). 


°Das entspricht auch der Voreinstellung in PRAAT. Andere Arbeiten haben in Auswahl: 
25,6 ms (Ramers 1988, 171); 20 ms und Hamming-Fenster (Hermansky 1990); 25 ms und Hanning- 
Fenster (Zahorian/Jagharghi 1993); 16ms und 8ms Versatz (Hillenbrand u.a. 1995); 20 ms Län- 
ge und 2ms Versatz (Pätzold/Simpson 1997, 224); 49ms und 5ms Versatz (Watson/Harrington 
1999); 25 ms und 2,5 ms Versatz (Fletcher u.a. 2015, 2134). 
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Lautschallsignal 


Lautsegment 


| Fenster 


Lautsignal 


Abbildung 4: Vom Lautschallsignal zum Lautsignal. Aus einem Lautschallsignal 
(oben) wird ein repräsentatives Lautsignal (unten) generiert. Dazu wird eine Folge 
von Ausschnitten (Fenster) aus dem Lautschallsignal extrahiert (das hier exempla- 
rische Fenster ist eine direkte Kopie des Lautschallsignals; in der Regel wird hier 
noch eine Fensterfunktion angewendet um Randeffekte abzudämpfen: Vgl. Abbil- 
dung 5 auf $.38). In jedem Fenster findet eine Berechnung mit einer Analysefunktion 
statt (hier: Berechne die Signalenergie in dem Ausschnitt). Die Folge der Ergebnisse 
der Analysefunktion pro Fenster ergeben ein Lautsignal (hier: Signalenergie). Die 
Lautsegmente entsprechen in dieser Darstellung den phonetischen Lauteinheiten im 
Signalbereich (Die hier wiedergegebenen Lautsymbole folgen der phonematischen 
weiten Hochdeutsch-Transkription des Kiel-Korpus, vgl. Abschnitt 4.1.2 ab $S.113). 
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Keine Fensterfunktion Hammingfenster Gaußfenster 
T T T T T —T T T T T T T T T T T T 
0 5 10 15 20 25 0 5 10 15 20 25 0 5 10 15 20 25 
t [msec] t [msec] t [msec] 


Abbildung 5: Sprachsignalausschnitt der Länge 25ms aus der Mitte des [ar] in 
Abbildung 6 auf S.39. Hier ist das Lautschallsignal dargestellt ohne übergelagertes 
Fenster, mit Hamming-Fenster und mit Gauß-Fenster. 


Der klassifikationsphonetischen Einheit Laut entspricht im messphonetischen 
Signalbereich das Lautsegment. Die Grenzen der Lautsegmente werden für den 
VOKALJÄGER im derzeitigen Entwicklungsstadium als bekannt vorausgesetzt. 


3.1.2 Das Wesen der akustischen Größe 


Die technische Informationsdichte in einem Lautschallsignal ist recht hoch. Sie liegt 
mit um die 50 kbit/s für einfache Telefonsprache drei Größenordnungen über der 
linguistischen Informationsdichte, die von Hermansky (1998, 6) mit nur 50 bit/s 
angegeben wird. Das liegt darin begründet, dass das Lautschallsignal in einem 
sich vergleichsweise langsam ändernden Vokaltrakt erzeugt wird, der mit wenigen 
artikulatorischen Stellungen auskommt, die mit dem linguistischen Code korre- 
spondieren. Rabiner/Schafer (1978, 98) notieren: 


„In particular, waveform plots [...] show the properties of the speech signal change relative- 
ly slowly with time. For many speech sounds it is reasonable to assume that the general 
properties of the excitation and vocal tract remain fixed for periods of 10-20 ms.“ 


Dieser Sachverhalt lässt sich gut in Abbildung 6 erkennen. Das Diagramm zeigt das 
Lautschallsignal des Wortes Strafe, [ft"ra:fo], eines weiblichen Sprechers!®. Die ge- 
samte Äußerung dauert etwa 500 ms. Klar zu erkennen ist, wie sich die äußere Form 


10Rs handelt sich um die Sprecherin K10 des Kiel-Korpus, Marburgsatz 2 und Segmentierung 
nach dem Kiel-Korpus. Diese und alle folgenden phonetischen Transkriptionen des Hochdeutschen 
folgen Mangold (2005), gegebenenfalls angepasst an die vorliegende Äußerung des Kiel-Korpus. 
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Abbildung 6: Lautschallsignal und einhüllender Tonenergieverlauf der Äußerung 
Strafe, [ft"ra:fo], einer weiblichen Sprecherin über die Zeit t in [ms]. 


0 100 200 300 400 500 


Abbildung 7: Geglättetes Frequenzspektrum der Äußerung aus Abbildung 6 über 
die Zeit t. Die Graustufen zeigen die Schallenergiedichte E in [dB] pro Frequenz f 
in [kHz] an. 
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des Lautschallsignals ändert und innerhalb der angegeben phonetischen Segmente 
einheitlich bleibt. Abbildung 7 zeigt das Frequenzspektrum derselben Äußerung im 
Verlauf über die 500 ms (genauer: des logarithmierten Amplitudenspektrums). Die 
originale Abtastrate von 16 kHz des Quellsignals wurde auf die für den VOKAL- 
JÄGER üblichen 10 kHz unterabgetastet, woraus sich die obere Grenzfrequenz von 
5 kHz für die Frequenz f ergibt. Auch wurde das Spektrum geglättet!!. Der Grau- 
ton im Diagramm zeigt die Intensität pro Frequenzband an, wobei dunkle Töne 
einer hohen Schallenergie entsprechen: Der höchste Wert tritt im [a:] auf und ist 
etwa 50 dB lauter als die Stille, die dem Plosiv [t"] vorangeht und hier mit OdB als 
Nullreferenz angesetzt wurde'?. Genau wie im Lautschallsignal ist das spektrale 
Muster deutlich unterschiedlich zwischen den einzelnen phonetischen Segmenten, 
aber innerhalb derselben recht einheitlich. Man erkennt an der dunklen Färbung 
bzw. Intensität die relative Lautheit der vokalischen Segmente [a:] und [o] sowie 
dort die Konzentration der Schallenergie im niederfrequenten Bereich unterhalb 
von 1,5 kHz. Anders ist die Situation beim Frikativ [[], der tendenziell mehr Schal- 
lenergie im höherfrequenten Bereich über 2kHzhat. 


Für den VOKALJÄGER ist das originale Lautschallsignal ein ungeeigneter Aus- 
gangspunkt. Vielmehr sind jene langsam veränderlichen auditorischen Parameter 
in einem Lautschallsignal zu suchen und zu bestimmen, die für die Laut- bzw. 
Merkmalsklassifikation ausreichen. Diese Parameter seien hier als akustische Grö- 
Sen bezeichnet. Die akustischen Größen fallen in bestimmte Klassen und werden 
in den folgenden Abschnitten beschrieben. Hier ein kurzer Überblick: 


—- Spektrum: Viele Experimente haben gezeigt, dass die wesentlichen Informa- 
tionen der Sprache im Frequenzspektrum zu suchen sind: Das spektrale Muster 
ist der Fingerabdruck des Lauts!®. Es gibt verschiedene Formen, Spektren zu 
beschreiben. Die für den VOKALJÄGER bei weitem wichtigste ist die Beschrei- 
bung des Spektrums durch seine Maxima, die Formanten (vgl. Abschnitt 3.2 
ab S.42). Auf der akustischen Größe Formant und den sie betreffenden Re- 
chenmodellen liegt der Schwerpunkt dieser Arbeit. Andere auf dem Spektrum 


HH Technisch erfolgte die Glättung mit der LPC-Methode, vgl. Formel (47) aus dem Anhang 
A.3.1 ab S. 443. 

12Die tendenziell geringe zeitliche Genauigkeit — gut zu erkennen gegenüber Abbildung 6 auf 
$.39 beim verschobenen Einsetzen des [?] - ist rein mathematisch bedingt durch die hier bewusst 
gewünschte hohe Auflösung des Frequenzbereichs von 0 bis 5kHz in 128 Bänder (was 256 Ab- 
tastwerten im Zeitbereich und damit einem Zeitfenster von 25,6 ms entspricht, welches wiederum 
eine zeitliche Unschärfe von +12,8ms bedingt). Man spricht hier von einem Schmalbandspektro- 
gramm (Oppenheim/Schafer 1992, 824-828). Wäre eine genauere Zeitauflösung gewünscht, also 
ein sogenanntes Breitbandspektrogramm, ginge dies mit einem Verlust an spektraler Genauigkeit 
einher: Ein 5 ms langes Fenster mit 50 Punkten bei einer Abtastfrequenz von 10 kHz erlaubt nur 
25 Bänder im Frequenzbereich zu unterscheiden. 

13Es sei hier angemerkt, dass das menschliche Ohr hinsichtlich der Phase taub (phase deaf) 
ist (Milner 1970, 217). Entsprechend setzen die akustischen Größen des Spektrums auf dem 
Amplitudenspektrum auf und ignorieren das Phasenspektrum. Jeder Bezug auf ‚Spektrum‘ ist 
somit als Bezug auf das Amplitudenspektrum zu lesen. 
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basierende akustische Größen existieren, sind aber zurzeit noch nicht vollum- 
fänglich im VOKALJÄGER implementiert (vgl. Abschnitt 3.4.4 ab $.73). 


- Grundfrequenz: Die Grundfrequenz, also die Frequenz der Stimmbandschwin- 
gung, hat sich für verschiedene messphonetische Verfahren und die Klassifika- 
tion als brauchbar erwiesen (vgl. Abschnitt 3.4.1 ab S. 72). 


— Lautdauer: Die Lautdauer, also die Länge der Lautsegmente bzw. der Laute, 
ist naturgemäß vor allem hilfreich, lange und kurze Vokale zu unterscheiden 
(vgl. Abschnitt 3.4.3 ab $. 73). 


— Energie: Die Schallenergie des Lautschallsignals kann hilfreich dabei sein, z.B. 
Reduktionsvokale zu klassifizieren (vgl. Abschnitt 3.4.2 ab S. 72). 


Die vollständige technische Auflistung der akustischen Größen des VOKALJÄGERS 
findet sich dann in Abschnitt 3.7.5 ab S. 108. 
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3.2 Formanten 


3.2.1 Das Röhrenmodell des Vokaltrakts 


Ausgangspunkt für die akustischen Größen des Spektrums ist ein Modell der Spra- 
cherzeugung. Technisch wird dabei der Vokaltrakt als ein mathematisches Filter 
angesetzt: im Fall eines Vokal wird ein Signal mit wenig Information — der Lunge 
entströmende Luft mit periodischem Stimmbandschlag - durch den anatomischen 
Sprechapparat des Vokaltrakts gefiltert. Das resultierende Signal, der Lautschall 
bzw. das digitale Lautschallsignal, trägt nun die Information, die der Vokaltrakt 
dem Luftstrom in seiner Artikulation aufgeprägt hat. Die Information ist zum einen 
die des gesprochenen Lauts, zum anderen die Anatomie des Vokaltrakts (insbeson- 
dere seiner Länge). Die Filterfunktion des Vokaltrakts kann abstrahiert modelliert 
werden. Eines der wichtigsten klassischen Modelle dafür ist die Repräsentation des 
Vokaltrakts durch ein System von verlustfrei miteinander kommunizierenden Röh- 
ren (Fant [1970], Rabiner/Schafer [1978, 55-106] und Deller u.a. [1992, 151-221]). 
Das analoge Röhrensystem ist durch einen Satz von wenigen Parametern einfach 
zu beschreiben und bildet ein einfaches lineares Model: 


„Thus, a terminal analog model involves a slowly time varying linear system excited by an 
excitation signal whose basic nature changes from quasi preiodic pules for voiced speech to 
random noise for unvoiced speech“ (Rabiner/Schafer 1978, S. 98). 


Dieses Röhrenmodell, in seiner Form als digitales Linear-Prediction-Filter, bildet 
die theoretische und mathematische Grundlage der Formanten und der Algorith- 
mik des VOKALJÄGERs. Die Mathematik ist im Anhang A.3.1 ab S. 443 detailliert. 


3.2.2 Formantfrequenz und Formantbandbreite 


Wie schon in Abschnitt 3.1.2, $.38f., angemerkt, ist die für die Lautklassifikation 
wesentliche Information im Spektrum des Lautschallsignals bzw. in der zeitlichen 
Veränderung desselben zu suchen. Für die einzelnen Vokale weist das Amplituden- 
spektrum charakteristische Formen auf, was sehr gut in Abbildung 8 auf S. 43 zu 
erkennen ist!*. 


}4Dje Messung basiert auf einer Referenzaussprache der IPA-Kardinalvokale, wie sie von ihrem 
Erfinder Daniel Jones in den 1950er-Jahren zur Demonstration auf Schallplatte eingesprochen 
wurde (vgl. Abschnitt 4.1.3 ab $S. 113 zu weiteren Informationen über diese Aufnahme). Die darge- 
stellten Spektren sind 18 exemplarisch ausgewählten repräsentativen Bereichen unterschiedlicher 
Länge der auf 5kHz tiefpassgefilterten Aufnahme entnommen worden. Dazu wurden N = 13 
LP-Parameter a, direkt aus Formel (40) von S.443 errechnet und mittels Formel (47) von S. 445 
in ein geglättetes K = 1.024-Punkte Amplitudenspektrum überführt. Präemphase nach Formel 
(49) von S. 446 wurde angewendet (eigene Berechnung in R). Abbildung 59 auf S. 154 und Tabelle 
20 auf S.156 dokumentieren dann die volle Statistik der gesamten Kardinalvokalaufnahme. 
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Abbildung 8: Amplitudenspektren aller IPA-Kardinalvokale in ihrer IPA- 
Normaussprache, bestimmt aus exemplarischen Einzelproben, die einer von Daniel 
Jones eingesprochenen Schallplattenaufnahme entnommen sind (Jones 1956). Die 
Anordnung folgt dem IPA-Vokaltrapez aus Tabelle 3 auf S.22. Dargestellt sind LP- 
geglättete Spektren über einen Frequenzbereich von 100 Hz bis 5 kHz (eigene Berech- 
nung). Der Wertebereich der y-Achse entspricht jeweils 60 dB. Die grauen vertikalen 
Linien markieren die Lage der ersten drei Formanten, die mit den Maxima der Spek- 
tren korrespondieren. Für die Vokale des Englischen findet sich eine Darstellung in 
Deller u.a. (1992, 122-123), die analoge Spektralmuster zeigt. 
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Die Spektren der IPA-Vokale sind mehr oder weniger unterschiedlich. So ist das 
Spektrum des [i] fundamental verschieden zu dem des [u], aber ähnlich dem des [ı] 
oder des [y]'?. Aus der Ähnlichkeit der Spektren ergibt sich die phonetische Ähn- 
lichkeit aus auditorischer Sicht. Die herausragenden und wesentlichen Merkmale 
eines jeden Spektrums sind die an bestimmten Frequenzen deutlich auftretenden 
Maxima. Diese korrespondieren mit den Resonanzfrequenzen des Vokaltrakts und 
werden als Formanten bezeichnet: 


„Since these resonances tend to ’form’ the overall spectrum, speech scientists refer to them 
as formants. This term is often used to refer to the nominal center center frequencies of the 
resonances, so formant may be used interchangeably with formant frequencies“ (Deller u.a. 
1992, 338). 


Die Formanten bzw. Formantfrequenzen werden als F1, F2, F3 usw. durchnum- 
meriert, wobei F1 dem ersten Formanten, F2 dem zweiten, F3 dem dritten usw. 
entspricht und die Zählung mit der niedrigsten Resonanzfrequenz, dem ersten Ma- 
ximum, beginnt. F1, F2 und F3 sind in Abbildung 8 jeweils mit vertikalen Linien 
markiert. Die Resonanzfrequenzen des Vokaltrakts sind üblicherweise als deutliche 
Maxima im Amplitudenspektrum zu erkennen, doch ist dies nicht eine notwendi- 
ge Bedingung. In Abbildung 8 sind die in dieser Aufnahme kritischen Formanten 
gut zu erkennen. So korrespondiert F2 im [u] nur mit einer leichten Wölbung im 
Spektrum - bei [o] und [>] ist das F2-Maximum deutlicher. Im Fall von [e], [a] und 
[n] liegen F1 und F2 so nahe zusammen, dass mit dem Auge keine Trennung im 
Spektrum möglich erscheint. Dieses Phänomen bezeichnet man als formant merger. 

Für die Berechnung der Formanten existiert ein umfangreiches methodisches 
Instrumentarium. Die intuitiv zugängliche Methode des peak picking glättet zuerst 
das Spektrum und bestimmt dann die Maximalwerte numerisch, stößt aber bei 
nahe zusammenliegenden Formanten, wie etwa hier in [e], an ihre Grenzen. In 
der Methode des root findings nutzt man die mathematischen Eigenschaften des 
Vokalttrakfiltermodells aus, um die Resonanzfrequenzen direkt zu errechnen!®. Zu 
den mathematischen und technischen Details der Berechnung sowie der Diskussion 
sei auf den Anhang A.3.1 ab S.443 und die Literatur verwiesen (Snell/Milinazzo 
[1993], O’Shaughnessy [2008], Deller u.a. [1992, 336-338] und Rabiner/Schafer 
[1978, 442 und 450-451]). 

Für Formantberechnungen gibt es bereits fertig implementierte Programman- 
wendungen. Der de-facto-Standard in der Phonetik, die Software PRAAT (Boe- 
rsma/Weenink 2015), wird auch im VOKALJÄGER verwendet!’. Eine Alternative 


157u dem (seltsamen) Klang von [y] und auch [@] in der Aufnahme von Daniel Jones vgl. 
Abschnitt 4.6.2 auf S. 154. 

16Hier ermittelt man die Nullstellen des Nenners im LP-Polynom aus Formel (43) von $.444 
und wendet dann Formel (44) von S.444 an. Diese Methode wurde zur Berechnung der in Ab- 
bildung 8 auf S.43 eingezeichneten Formanten angewendet, wobei hier f, 10kHz ist. 

7Hatten ältere Arbeiten noch eigene Implementierungen, wird in neueren Arbeiten häufig 
PRAAT verwendet; so etwa in den letzten Jahren in Auswahl: Sendlmeier/Seebode 2006; Nance 
2013; Williams/Escudero 2014; Mortona/Sommers 2015; Mielke 2015; Fletcher u.a. 2015. 
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Abbildung 9: LP-geglättetes Amplitudenspektrum des [a:] in Strafe auf einer li- 
nearen Frequenzskala. Markiert sind die ersten drei Maxima des Spektrums, die 
Formanten Fl, F2 und F3. Grau unterlegt sind die Formantbandbreiten Bl, B2 und 
B3 (hier kalibriert auf 1dB Absenkung vom Maximum, wobei über die linke und die 
rechte Seite gemittelt wurde). Die Angabe der Werte ist in Hertz. 


zur digitalen Formantmessung bis in die 1990er-Jahre war die analoge Analyse mit 
dem Spektrographen. Die Weiterverarbeitung erfolgt im VOKALJÄGER mittels der 
Statistiksoftware R (R Development Core Team 2015). 

Die Formantbandbreite gibt an, wie breit das Formantmaximum im Amplitu- 
denspektrum ausgeprägt ist. Die Formantbandbreiten werden mit Bl, B2 usw. 
bezeichnet. Eine niedrige Bandbreite steht für eine schmale Spitze, eine höhere für 
ein breitere, die sich in der Regel mit den Nachbarspitzen überlagert. Abbildung 
9 auf S.45 zeigt das Amplitudenspektrum eines [a:] mit den drei Formantfrequen- 
zen F1 bis F3 und den drei Formantbandbreiten B1 bis B3!®. Die Bandbreiten 
stehen in einer Beziehung zu den Formanten. Hawks/Miller (1995) finden eine U- 
Form: Im Bereich von 400 Hz bis 1.000Hz sind die Bandbreiten flach auf einem 
Minimum von etwa 50 Hz, außerhalb ansteigend. Der Anstieg jenseits von 2.000 Hz 
ist extrem steil. Die Muster, die sich aus dem Verhältnis zwischen Formantwert 
und Formantbandweite ergeben, werden im VOKALJÄGER zur Qualitätssicherung 
verwendet (vgl. Abschnitt 3.7.4, dort Punkt 6 auf S. 106). 

Das Amplitudenspektrum ist durch seine Resonanzen und die Bandbreiten voll- 
ständig definiert!?. Dies ist in Abbildung 10 auf S.46 veranschaulicht. Dort wer- 
den die Spektren der von Jones gesprochenen Kardinalvokale [e] und [o] Schritt 


18Die Bandbreiten werden üblicherweise mit Formel (45) von $. 444 bestimmt. Abbildung 9 auf 
S.45 veranschaulicht die Bandbreite als den Bereich, in dem das Spektrum 1dB vom Maximum 
am Formantgipfelpunkt abfällt, jeweils gemittelt über linke und rechte Seite — dies vermeidet 
in dieser Situation die zu erwartende Überlappung mit Nachbarbandbreiten, die sich bei den 
üblicherweise angesetzten 3dB ergeben hätte. 

197Zu den Details vgl. Anhang 3.2.1 ab $.42 und insbesondere die Formeln (43) von $.444 und 
(46) von S. 444. 
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Abbildung 10: Das ‚Formen‘ der LP-Amplitudenspektren von [e] (oben) und [o] 
(unten) aus den Formanten und Formantbandweiten. Zur Konstruktion des Spek- 
trums wird nur der erste Formant (Fl), dann die ersten beiden (F12), dann die 
ersten drei (F123) usw. herangezogen. Deutlich ist zu erkennen, wie sich dabei die 
unterschiedlichen Charakteristika der Spektren formen. 
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für Schritt aus den Formanten bzw. Resonanzen und den Formantbandweiten ‚ge- 
formt‘. Wird nur der erste Formant herangezogen (in der Abbildung 10: F1), sind 
die Formen der Spektren weitgehend identisch: Die erste Formantfrequenz Fl liegt 
für sowohl [e] als auch [o] knapp unter 400Hz. Durch Hinzunehmen des zweiten 
Formanten F2, also dem ‚Formen‘ des Spektrums aus F1 und F2 (in der Abbildung: 
F12) und dann noch zusätzlich des dritten Formanten F3 (in der Abbildung: F123) 
bilden sich deutliche Unterschiede heraus. Während bei [e] eine starke Spreizung 
zwischen Fl und F2 sowie F3 entsteht, ist diese bei [o] mit einem F2-Höcker zwi- 
schen Fl und F3 aufgehoben. Die Hinzunahme von F4 ergänzt das Spektrum nur 
unwesentlich. Das Gleiche gilt für die hier nicht mehr gezeigten höheren Formanten 
wie F5, F6 usw. 

Aus den theoretischen Modellen, die den Vokaltrakt als eine Folge von mehreren 
Röhren mit einer Gesamtlänge von ca. 17 cm ansetzen, ergibt sich physikalisch grob 
eine Resonanzfrequenz pro kHz, beginnend bei 500 Hz (O’Shaughnessy 2008, 218- 
219). Wie deutlich in Abbildung 8 auf S.43 zu erkennen ist, dominieren über alle 
Vokale hinweg die ersten drei Maxima die Spektren, die, der Theorie entsprechend, 
einen Bereich bis etwa 3,5 kHz abdecken. 


3.2.3 Formantdiagramme 


Abbildung 8 auf $S.43 zeigte die Spektren exemplarisch ausgewählter Einzelpro- 
ben der von Jones gesprochenen Kardinalvokale (vgl. Abschnitt 4.1.3, S. 113f., 
zu dieser Aufnahme). Die genau diesen ausgewählten Spektren zugrundeliegen- 
den Formantfrequenzen sind in Tabelle 5 auf S.48 aufgeführt und in den darauf 
folgenden Abbildungen 11 und 12 ab S.49f. für F1/F2 sowie F2/F3 und F2/FA 
eingezeichnet”. 

Die grafische Darstellung der Formanten als Punkte in einer Ebene, bei der die 
horizontale x-Achse F2 umgekehrt und logarithmisch gegen Fl auf einer ebenfalls 
umgekehrten und logarithmischen vertikalen y-Achse abträgt, ist der heutige De- 
facto-Standard: Das entspricht der Darstellung in Abbildung 11 auf S. 49°!. Präsen- 
tationen von Formantmesswerten in diesen sogenannten Formantdiagrammen, hier 
in der F1/F2-Ebene, werden schon sehr früh als „illuminating“ eingeführt (Joos 
1948, 51£.): „Since then the F1/F2 plane has become one of the standard ways 
of comparing vowel quality“ (Harrington 2013, 84). Abbildung 11 auf $S. 49 ähnelt 
dem IPA-Vokalviereck aus Abbildung 3 auf S. 22, was zum einen an der gewählten 
Darstellungsweise liegt: „Of course the scales of these diagrams were deliberate- 
ly set up so as to enhance the resemblance of the accoustic chart to the tongue 
position chart“ (Joos 1948, 53). Die Ähnlichkeit ist aber nicht selbstverständlich. 


20Rs handelt sich hier um exemplarische Einzelwerte zu Illustrationszwecken, die mit den 
Spektren in Abbildung 8 auf S. 43 korrespondieren. Eine vollständige Statistik auf Basis des Vo- 
KALJÄGERS findet sich dann in Abschnitt 4.6.2 ab S.154. Doch lassen sich mit dem aufgeführten 
Beispielen schon die wesentlichen Kennzeichen erläutern. 

?lDie im hinteren Teil der Arbeit verwendeten Formantdiagramme sind leicht unterschiedlich 
und weisen andere Achsskalen auf (vgl. Abschnitt A.3.2 ab S. 446 zum Entwurf und Aussehen). 
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CV IPA Fl F2 F3 FA 
1 i 240 2.500 3.500 3.800 


2  e 370 2.100 2.400 2.600 
3 2 560 1.900 2.300 3.500 
4 a 890 1.400 2.200 3.200 
5 a 720 910 2.400 3.300 
6 93520 890 2.400 3.300 
7 0 37 740 2.200 3.000 
8 u 210 700 2.200 3.500 
9. y 289 2.100 2.600 3.600 
10 A 360 1.900 2.300 3.300 
11 @ 540 1.600 2.100 2.800 
12 & 710 1.300 1.900 3.100 
13» 650 810 2.600 3.500 
14 A 550 1.200 2.300 3.300 
15 x 410 1.100 2.300 3.600 
16 w 2 320 1.200 2.300 3.700 
17 + 290 2.000 2.400 3.600 
u 


300 1.400 2.000 3.100 


Tabelle 5: Formantwerte der exemplarischen Kardinalvokalspektren aus Abbildung 
11 auf S.49, gesprochen von Daniel Jones (eigene Messung; hier auf 2 Stellen genau 
notiert; vgl. auch Tabelle 20 auf $.156, die eine Statistik auf Basis der gesamten 
Kardinalvokalaufnahme zeigt). 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


Formanten 49 


250 - 


Se 


F1 [Hz] 


500 - 


750 - 


2000 1500 1000 750 
F2 [Hz] 


Abbildung 11: Das Formantdiagramm zeigt die Formanten Fl und F2 der von 
Daniel Jones gesprochenen exemplarischen Kardinalvokalspektren aus Abbildung 
11 auf S.49 (eigene Messung). In dieser Darstellung der Formanten in der F1/F2- 
Formantebene ist F2 gegen Fl abgetragen. Verbunden sind jeweils die ungerundeten 
Vokale (durchgezogene Linie) und die gerundeten Vokale (gestrichelte Linie). Es ent- 
steht eine deutliche Viereckform (vgl. auch Abschnitt 4.6.2 ab S. 154 für eine Statistik 
auf der gesamten Aufnahme). Eine ähnliche Messung an der Jones Aufnahme führten 
auch Lindblom/Sundberg (1969, 24) sowie Thomas (2010, 146) durch und kommen 


zu vergleichbaren Ergebnissen und Mustern. 
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Abbildung 12: Die Formanten F3 und F4 der Kardinalvokale abgetragen gegen 
F2. Aus F3 gegen F2 entsteht eine Bogenform (links). F4 gegen F2 enthält kaum 


Informationen (rechts). 
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Das IPA-Vokalviereck ist auditorisch motiviert bzw. eine grafische Darstellung der 
verschiedenen, miteinander kontrastierenden sprachmotorischen Merkmale (Lage 
der Zunge, Öffnungsstufe, Rundung der Lippen usw.). Die F1/F2-Ebene ist das 
Ergebnis einer physikalischen Messung und einer algorithmischen Berechnung. Es 
fällt auf, dass das IPA-Vokalviereck der technischen Messung sehr wohl ähnelt, aber 
nicht mit ihr identisch ist. Die Begründung der Ähnlichkeit liegt in der — hier nun 
augenscheinlich werdenden - Korrelation zwischen sprachmotorischen Merkmalen 
bzw. klassifikationsphonetischem Lautsymbol und diesen auditorischen Messwer- 
ten. Das IPA-Vokalviereck in der Darstellung aus Abschnitt 2.2.1 ab S.20 kann 
somit als eine theoretische Abstraktion der auditorischen Messwerte in der For- 
mantebene angesehen werden (vgl. Abschnitt 3.2.4 ab S.52 zum Nutzen dieser 
Information in der Klassifikation und den Herausforderungen). 

Das starke Muster, das sich bei den ersten beiden Formanten F1 und F2 zeigt, 
wiederholt sich nicht mit dem dritten oder gar dem vierten Formanten. Während 
in Abbildung 11 auf S. 49 im Zeichnen von F1 gegen F2 die deutliche Geometrie des 
Vokalvierecks hervorsticht, zeigt sich in Abbildung 12 auf S. 49, welches F3 gegen 
F2 aufführt, nur ein leichtes Muster durch eine Bogenform in F3. In der Darstellung 
von F4 gegen F2 findet sich kein Muster in F4 mehr. Die starke Unterscheidung 
der Vokale in der F1/F2-Ebene gegenüber der schwachen Unterscheidung in der 
F2/F3-Ebene und der de facto nicht vorhandenen in der F2/F4-Ebene lässt nur 
eine Vermutung zu: Die notwendige Information zur Unterscheidung der Vokale 
liegt in den Unterschieden von F1 und F2, hinreichende Informationen mögen in 
F3 zu finden sein, und F4 scheint kaum eine Rolle zu spielen. Dies wird sich später 
in den Messungen aus Kapitel 6 ab S. 215f. bestätigen. 


Diese wesentlichen Merkmale und Zusammenhänge, wie sie sich in den Abbildun- 
gen 11 und 12 auf S.49 darstellen, sollen nun hier kurz umrissen werden:?? 


1. Mit zunehmendem Öffnungsgrad steigt Fl an (sinkt im Formantdiagramm 
ab). Dies zeigt sich, wenn man die Serie der geschlossenen Kardinalvokale 
Ii/y/i/a/ur/u] mit der der halbgeschlossenen [e/o/v/o] und mit der der halbof- 
fenen [e/ce/a/o] vergleicht. Innerhalb einer Serie ist F1 in etwa gleich, aber F2 
unterschiedlich. Bei höchstem F1 gilt Ähnliches für die offenen Kardinalvokale 
[®/a/a/p], doch liegen hier die F1-Werte nicht mehr auf einer Horizontalen. 


Der physikalische Grund für das Gesamtmuster ist, dass die erste Reso- 
nanzfrequenz des Vokaltrakts (Fl) mit wachsendem Zwischenraum zwischen 
Zunge und Rache ansteigt. Ebenso hebt abnehmende Beschränkung im Gau- 
menbereich die erste Resonanzfrequenz (Fl) an. Beide Effekte sind an der Serie 
von Vokalen, die die Öffnungsstufen geschlossen bis offen durchläuft, wie etwa 
Ii/e/e/a] gut zu beobachten. 


?2 Weiterführende Beschreibungen, insbesondere zu physikalischen Modellierungen, finden sich 
in Ungeheuer (1962), Fant (1970, 105-138), Lindblom/Sundberg (1971), Deller u.a. (1992, 122- 
125) und O’Shaughnessy (2008, 218-219). 
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2. Bei gleich bleibendem Öffnungsgrad ist F2 eines vorderen Vokals erheblich grö- 
ßer als F2 eines hinteren Vokals (ein höherer F2-Wert steht weiter links im 
Formantdiagramm; gleicher Öffnungsgrad entspricht gleichem F1 bzw. einer 
Horizontalen im Formantdiagramm). Dies zeigt sich im Vergleich von ungerun- 
detem-+vorderem mit ungerundetem-+hinterem Kardinalvokal: In der Serie der 
Paare [i/w], [e/v] und [e/Aa] weist das erste Glied (vorderer Vokal) immer einen 
größeren F2-Wert als das zweite Glied (hinterer Vokal) auf. Dies hat ebenso 
für [a/a] Gültigkeit, obwohl [a] eine Sonderrolle einnimmt. Das Gleiche gilt 
für die Serie [y/u], [p/o], [oe/>] und [®/n], die aus jeweils rundem+vorderem 
und rundem-+hinterem Kardinalvokal gebildet wurde. Die physikalische Ursa- 
che ist der Ort der Verengung im Vokaltrakt. Ist die Verengung am Anfang des 
Trakts (Vorderzungenvokale), wird F2 angehoben. Ist die Verengung am Ende 
des Trakts (Hinterzungenvokale), ist F2 abgesenkt. 


3. Lippenrundung senkt F2. Dadurch sind im Formantdiagramm 11 auf S. 49 die 
runden Vokale (gestrichelte Linie) gegenüber den ungerundeten Vokalen nach 
rechts verschoben (durchgezogene Linie). Dies zeigt sich in Paaren aus jeweils 
ungerundetem und rundem Kardinalvokal, wobei das F2 des ersten Glieds (un- 
gerundeter Vokal) immer größer als das F2 des zweiten Glieds (runder Vokal) 
ist: [i/y], [e/e], [e/o], /u], [w/u], [y/o] und [a/>]. Annähernd gilt dies auch 
für die offenen [a/«] und [a/n]. 


4. Lippenrundung senkt F3. In Abbildung 12 auf S.49 (links) sind daher die mit 
gestrichelter Linie verbundenen runden Vokale gegenüber den mit durchgezo- 
gener Linie verbundenen ungerundeten Vokalen leicht nach oben bzw. zu einem 
niedrigeren F3 hin verschoben. Jedoch ist das Muster in F3 gegen F2 wesentlich 
schwächer ausgeprägt als das Muster von F1 gegen F2 in Abbildung 11. 


5. Bei gleich bleibendem Öffnungsgrad liegt der F2-Wert eines Vokals mit zentraler 
Zungenlage zwischen dem F2-Wert des vorderen und des hinteren Vokals. Dies 
ist gut an [i] und [u] zu erkennen, die zwischen [i/y] und [uı/u] liegen. 


6. Der Vokal [a] hat eine Sonderstellung. Im Formantdiagramm liegt [a] mit höchs- 
tem Fl unter seinen IPA-Partnern [«@], [a] und [op]. Vom F2-Wert her liegt er 
im Bereich des [#] und des [@]. Aufgrund der F2-mittigen Lage werden Spra- 
chen, die hinteres [a] und/oder vorderes [x] vermissen, eher eine Dreiecksform 
in der F1/F2-Ebene von der Verteilung her annehmen. Sind sie vorhanden, 
werden [a], [@] und/oder [a] zusammen in der F1/F2-Ebene der Verteilung 
die Form eines Vierecks geben. Anzumerken ist auch, dass das hochdeutsche 
[a] noch zentraler als das Kardinalvokal-[a] erscheint (vgl. Abschnitt 4.6.3 ab 
S.157 zu den messphonetischen Ergebnissen zum A im Hochdeutschen). Das 
Kardinalvokal-[a] hingegen erscheint deutlich als vorderer Vokal: Er liegt in 
einer Flucht mit den Vordervokalen [i/e/e]. 
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3.2.4 Von der Mess- zur Klassifikationsphonetik 


Nun liegt der nächste Schritt nahe: Man kann hoffen, aus der Verortung der For- 
manten in der F1/F2-Ebene (und gegebenenfalls der F2/F3-Ebene sowie ande- 
rer akustischer Größen), auf die Laute rückzuschließen. Das ist die Kernidee des 
VOKALJÄGERS: Der Lautklassifikation liegt eine messphonetische Datenbasis zu- 
grunde. Während der Spracherzeugung verläuft der Weg vom klassifikationspho- 
netischen Laut zum messphonetischen Signal. Der VOKALJÄGER invertiert diese 
Schritte, indem er aus (messphonetischen) akustischen Größen den (klassifikati- 
onsphonetischen) Laut rückschätzt. 

Die Herausforderungen sind aber schon offensichtlich: Die aus dem Lautschall- 
signal errechneten Formanten sind zeitabhängige, kontinuierliche und quantitative 
Größen, während die klassifikationsphonetischen Merkmale und Schemata statisch, 
ordinal und qualitativ sind. Deswegen muss der messphonetische Apparat ein sta- 
tistischer sein. Die Statistik wird von zwei Dingen geprägt sein: Zum einen ist das 
Lautschallsignal und damit die daraus errechneten Formanten geprägt vom Spre- 
cher bzw. seinem Vokaltrakt. Die sich daraus ergebende Notwendigkeit einer Spre- 
chernormalisierung wird in Abschnitt 3.5 ab S. 74 im Detail diskutiert. Zum zwei- 
ten überträgt sich die schon in Abschnitt 2.2.2, S. 26 f., beschriebene Problematik 
direkt in die Messphonetik: Einzelne Sprachen oder Dialekte haben unterschiedli- 
che Artikulationsspezifikationen für ein und dasselbe Lautsymbol. Somit sind für 
ein und dasselbe Lautsymbol in unterschiedlichen Sprachen unterschiedliche For- 
mantstatistiken zu erwarten. Das Gleiche gilt für Formanten, die aus extremen 
IPA-Kardinalvokalen errechnet wurden (vgl. exemplarisch Abschnitt 3.2.3 ab S. 47 
und systematisch Abschnitt 4.6.2 ab S. 154). Auch sie werden nicht mit den Wer- 
ten einzelner Sprachen und auch nicht mit dem Hochdeutschen äquivalent sein. 
Innerhalb einer Sprache oder eines Dialekts und auch für einen einzelnen Sprecher 
sind (allophonische) Variationen zu erwarten. Die Schwankungsbreiten sind zum 
Teil erheblich (vgl. Abschnitt 4.3 ab S. 124 und Abschnitt 4.4 ab S. 137 für eine mit 
dem VOKALJÄGER ermittelte Statistik des Hochdeutschen und Abschnitt 4.6.4 ab 
S.159 für einen Vergleich der VOKALJÄGER-Formanten mit anderen Publikatio- 
nen). 

Der VOKALJÄGER setzt implizit quantitativ insbesondere auf den Formant- 
mustern des Hochdeutschen auf, indem er auf Lautschallsignale des Hochdeutschen 
‚trainiert‘ wird. Somit ist auch hier wiederum das Hochdeutsche Referenz. Das hier 
Gesagte gilt auch für andere akustische Größen. 


237u sprachübergreifenden komparativen Formantstatistiken sei hier z.B. auf Delattre (1965) 
und Strange u.a. (2007) verwiesen. 
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3.3 Formantbahnen 


3.3.1 Zeitfenster und Formantbahnen 


Doch wie misst man die Formanten in einem sich ändernden Lautschallsignal, wie 
z.B. in Abbildung 6 auf S. 397 Eine einfache Möglichkeit ist es, die Formanten aus 
der Gesamtheit des ausgewählten Signalsegments direkt zu errechnen, was einer 
spektralen Mittelung über das Segment gleichkommt. Dies ist für exemplarische 
Darstellungen angemessen — die Diagramme in den vorangehenden Abschnitten 
wurden so errechnet — doch eignet sich für die statistische Phonetik im VOKALJÄ- 
GER weniger. Dies liegt zum einen darin begründet, dass die Segmente unterschied- 
lich lang sind und damit zwingend unterschiedliche Auflösungen im Spektralbereich 
erhalten (vgl. Fußnote 12 auf S.40). Zum anderen, was man in Abbildung 7 auf 
S.39 erkennen kann, ändert sich die spektrale Information über die Zeit. Deut- 
licher Wandel findet zwar beim Übergang zwischen Vokal und Konsonant statt, 
doch auch innerhalb eines Vokals ist das Spektralmuster nicht notwendigerweise 
konstant. Möchte man diese Bewegung erfassen, etwa weil sie Untersuchungsge- 
genstand ist oder um ein Hilfsmittel zu schaffen, besonders repräsentative Teile 
des Segments zu finden, ist eine Berechnung in kleinen Zeitschritten in Zeitaus- 
schnitten nötig. Das ist das Konzept der Fenster (vgl. Abschnitt 3.1.1 ab S. 36). 
Errechnet man nun in jedem der Ausschnitte die Formanten, erhält man im Ergeb- 
nis eine Folge von Formantwerten Fit], Faft] usw. über die Zeit t in Schritten von 
z.B. 2ms. Diese sogenannten Formantbahnen (formant trajectories) sind exem- 
plarisch in Abbildung 13 auf $. 54 für verschiedene Vokalproben eines weiblichen 
hochdeutschen Sprechers dargestellt?*. 

Mit Abbildung 13 auf S.54 lassen sich die wesentlichen Herausforderungen 
erläutern. Im Fall vom [a:] in Strafe sind die Formanten im Zentrum der Mes- 
sung relativ stabil und die Formantbahnen von Fl, F2, F3 und F4 sind annä- 
hernd waagerecht und parallel zueinander. An den Randbereichen hingegen treten 
deutliche Abweichungen auf, welche durch den Einfluss der Nachbarlaute bedingt 
sind — hier dem [a:] vorangehendes [Jtr-] und nachfolgendes [-fo]. Der Artikula- 
tionsapparat ist noch bzw. schon von der Artikulationsstellung des vorgehenden 
bzw. nachfolgenden Lauts beeinflusst. Dieses Phänomen wird als Koartikulation 
bezeichnet. Betrifft es den vorangehenden Laut, handelt es sich um artikulatorisch 
biomechanische Koartikulation (left to right carry over coarticulation), betrifft es 
den nachfolgenden Laut, um kognitive Koartikulation (right to left anticipatory 
coarticulation). Koartikulation bzw. Kontextabhängigkeit des Lauts ist ein sprach- 


?4Rs handelt sich hierbei um Sprecherin K10 des Kiel-Korpus; Marburgsätze 31, 2, 43 und 
28; IPA-Transkript (Norm), Vokalansatz und Ende gemäß Korpus; Messung mit PRAAT, 25 ms 
Gauß-Fenster; 2ms Versatz; eigene Berechnung mit der Methode des VOKALJÄGER aus Abschnitt 
3.7, S.103f.; Darstellung über das ganze Signal, also ohne Beschränkung auf den 60% Kern. 
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Abbildung 13: Die Bahnen der ersten vier Formanten F}[t] bis Fy[t] sind hier über 
die Zeit t für exemplarische Vokalproben aufgetragen: [o:] in Kohlen, [ko:lon]; [a:] in 
Strafe, [tra:fo]; [>] in trockenes, [trokonss]; [a:] in vertragen, [fetra:gon]. F1 (jeweils 
untere Kurve) bis F4 (jeweils obere Kurve) sind mit den Symbolen 1 bis 4 markiert. 


übergreifendes Phänomen, das in den jeweiligen Einzelsprachen mit individuellen 
Ausprägungen auftritt (Öhman [1966], Recasens [1986], Lindblom u.a. [2007] und 
Graetzer u.a. [2015]). Die anderen Diagramme in Abbildung 13 zeigen weitere 
charakteristische Formen. Im [o:] von Kohlen verlaufen die Fl- und F2-Bahnen 
ansteigend. Im [5] von trockenes verlaufen Fl und F2 im Takt und erreichen beide 
ein Maximum etwa nach dem ersten Drittel der Lautdauer. Im [a:] von vertragen 
sind die Wölbungen von Fl und F2 unterschiedlich: Ungefähr in der Mitte wird Fl 
maximal und F2 minimal. Allen Äußerungen ist gemeinsam, dass F3 weitgehend 
gleich und konstant bleibt, doch deutliche Unterschiede in F1 und F2 auftreten. 


Neben der Koartikulation als bestimmendem Faktor können die Formantbah- 
nen noch eine eigene Binnenstruktur aufweisen, die nicht von den Nachbarlau- 
ten abhängt und so dem Laut eine charakteristische Färbung gibt. Strange/Bohn 
(1998, 500) etwa finden Unterschiede in der Symmetrie der F1-Formantbahn zwi- 
schen der gespannten und ungespannten Variante hochdeutscher Vokale (z.B. |i] 
gegenüber [1]); die F2-Formantbahn des australischen [i:] erreicht das stabile Zen- 
trum wesentlich später als hochdeutsches [ir] (Harrington 2013, 87) usw. Eine wei- 
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tere wichtige Überlegung ist der Zeitbereich, für den die Formantbahnen errechnet 
werden sollen. Der VOKALJÄGER rechnet nur auf dem 60% Kern des Vokalseg- 
ments: Es werden also 20% des Lautanfangs und -endes nicht berücksichtigt um 
Übergangseffekte abzumildern?®. 

Wenn nun das Charakteristische eines Vokallauts in seinen Formantbahnen ent- 
halten ist, kann aus der Form der Formantbahnen auf den Charakter des Lauts 
rückgeschlossen werden. Damit stellen sich zwei Fragen: Wie kann eine Formant- 
bahn mathematisch-technisch repräsentiert werden? Und wie viele Formantbahnen 
müssen berücksichtigt werden? Zur Frage der Repräsentation gibt es im Wesent- 
lichen zwei Ansätze, die in den Folgeabschnitten beschrieben werden: entweder 
Extraktion eines einzelnen repräsentativen Zielwerts aus der Formantbahn (vgl. 
Abschnitt 3.3.2 ab S.55) oder Parametrisierung der gesamten Formantbahn (vgl. 
Abschnitt 3.3.3 ab $.56). Extraktion am %-Punkt ist ein Beispiel für den ers- 
ten Ansatz und Errechnen eines Mittelwerts über die Formantbahn ein (extrem 
einfaches) Beispiel für den zweiten. Angemerkt sei hier, dass die Überlegungen 
für Formantbahnen genauso auch Gültigkeit für die Bahnen anderer akustischer 
Größen haben. 


3.3.2 Vokalziel und Formantzielwerte 


Der klassische Ansatz postuliert, dass die Formantbahnen einen stabilen Zielwert 
anstreben (formant target/vowel target), der mit der artikulatorischen Zielstellung 
des Sprechapparates korrespondiert. Damit bedarf es der Formantbahn als sol- 
cher in ihrer Gesamtheit nicht. Es muss nur der eine Punkt, der Formantzielwert, 
bestimmt und extrahiert werden. Dieser eine Messwert definiert die gesamte For- 
mantbahn. In der klassischen Studie von Lindblom (1963, 1778) heißt es: „A target 
was found to be independent of consonantal context and duration and can thus be 
looked upon as an invariant attribute of the vowel“. 

Doch wie findet man den Formantzielwert auf der Formantbahn? Die definitive 
Antwort steht noch aus: „There is no standard method for identifying where the 
vowel target occurs“ (Harrington 2013, 85). Es gibt eine Vielzahl von Ansätzen, 
die auch oft in Kombination angesetzt werden. Der einfachste besteht darin, den 
Formantzielwert an einem fixen Punkt zu extrahieren. Üblich ist etwa, die Mitte 
des Lautsegments anzusetzen?®. Das Formantziel „typically occurs nearest near the 
temporal midpoint“ (Harrington 2013, 85). Bei Zahorian/Jagharghi (1991, 69) ist 
es der %-Punkt. Eine weitere Alternative ist die Extraktion in der ersten Hälfte 
des Vokalsegments, insbesondere um den Einfluss des Folgevokals zu mindern. Ein 


?5Die Beschränkung auf einen 60% Kern folgt z.B. Williams/Escudero (2014, 2753). In Nance 
(2013, 139) wird ein 50% Kern angesetzt. 

26 Arbeiten, die, ohne Anspruch auf Vollständigkeit, den %-Punkt ansetzen sind etwa: Ramers 
(1988, 171), Hillenbrand u.a. (1995), Pätzold/Simpson (1997), Harrington u.a. (bei PCA: 2012, 
166), Gackstatter/Niebuhr (2012, 9), Mielke (2015, 2860), Graetzer u.a. (2015) und Fletcher u.a. 
(2015, 2134). 
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Beispiel ist der %-Punkt?’. Im VOKALJÄGER wird sowohl die Extraktion am ersten 
Drittel (%-Punkt) als auch am Mittelpunkt (%-Punkt) verwendet?®. 

Weitere Methoden suchen nach bestimmten Kriterien, die das Vokalziel aus- 
zeichnen, wie etwa das Maximum für F1 (insbesondere bei [a] und [e]), das Mini- 
mum von Fl (bei [y]), das Minimum von F2 (bei [u] und [o]), das Maximum von 
F2 (bei [il), den Punkt mit der höchsten Intensität, den Punkt mit der geringsten 
Veränderlichkeit (stationary steady state) usw””. Der so gefundene Punkt wird oft 
als articulatory point bezeichnet. Im VOKALJÄGER darf Kenntnis des Vokallauts 
nicht vorausgesetzt werden, denn genau diesen soll der VOKALJÄGER bestimmen. 
Dementsprechend kann eine explizit lautabhängige Extraktion des Formantziel- 
werts wie eben beschrieben nicht durchgeführt werden. Wohl aber weisen manche 
Formantbahnen charakteristische Bogenformen mit einem deutlichen Maximum 
oder Minimum auf. So liegt es nahe, eine Extraktion an diesem Punkt zu ver- 
suchen. Dieses hier Scheitelpunkt-Methode genannte Vorgehen (peak picking) ist 
im VOKALJÄGER als Alternative zur Extraktion am fixen 1 oder %-Punkt im- 
plementiert. Dabei wird zuerst nach einem Auftreten eines deutlichen Maximums 
für F1 gesucht und dann nach einem deutlichen Minimum für F2. Im Fall eines 
Scheiterns wird der /%-Punkt angesetzt, da ja dann die Formantbahnen ohne Aus- 
bildung eines Extremwerts geradlinig verlaufen (vgl. zu den technischen Details im 
VOKALJÄGER Abschnitt 3.7.4, Schritt 5, S. 106)". 

Welche Methode zur Bestimmung des Zielwerts ist nun optimal? Es zeigt sich, 
dass die Unterschiede gering sind. Die Vergleichsstudie von Son/Pols (1990, 1692), 
die die im Vorgang beschriebenen Methoden untersucht, kommt zum Schluss: 


„However, the differences between the various methods used are, in most respects, marginal 
and all methods used essentially give the same outcome. When studying vowel targets the 
method that is most convenient can be used.“ 


Der VOKALJÄGER, in dem verschiedene der in diesem Abschnitt eingeführten 
Verfahren implementiert sind, wird später zu ähnlichen Ergebnissen kommen (vgl. 
Abschnitt 6 ab S. 215). 


3.3.3 Formantbahnparametrisierung 


Es ist möglich, die Formantbahn in ihrer Gesamtheit zu parametrisieren. Dies be- 
deutet, dass prinzipiell alle Einzelheiten der Formantbahn - oder alternativ auch 
nur ihre maßgeblichen Wesenheiten - in einem Parametersatz dargestellt werden 


?7So etwa in: Strange/Bohn (1998, 497) und Fridlanda u.a. (2014, 243). 

28711 beachten ist, dass der %-Punkt im VOKALJÄGER aus dem 60% Kern des Vokalsegments 
bestimmt wird. Damit entspricht er dem %o-Punkt, bezogen auf das gesamte Vokalsegment. 

?9In Auswahl Arbeiten aus dieser Gruppe: Ramers (1988, 171), Son/Pols (1990), Harrington 
u.a. (2000, 67), Nance (2013, 139), Mortona/Sommers (2015) und Fletcher u.a. (2015, 2134). 

30Eine besondere Herausforderung kann entstehen, wenn das Formantziel gar nicht erreicht 
wird, z.B. bei schneller Aussprache. Bei den mit dem VOKALJÄGER untersuchten Proben stellte 
sich diese Problematik als nachrangig heraus. 
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können. Ein solcher Parametersatz liefert eine vollständige dynamische Beschrei- 
bung der Formanten über die Zeit und stellt eine Alternative zu den im vorherigen 
Abschnitt eingeführten statischen Formantzielwerten. 

Die sicherlich einfachsten Verfahren sind solche, die die Formantbahn durch 
ihren Mittelwert, Median oder andere einzelne statistische Maßzahlen darstellen. 
Dann besteht der Parametersatz, der die Formantbahn repräsentiert, aus nur die- 
ser einen Kennzahl. Für weitgehend stabile und konstante Bahnen spricht nichts 
gegen ein solches Verfahren, doch sind bei Bahnen mit deutlicher Steigung oder 
Krümmung andere Verfahren zu erwägen. Eine in diese Richtung angepasste Me- 
thode ist es, die Formantbahn durch eine Folge aus ihr extrahierter Punkte zu 
approximieren, die dann den Parametersatz bilden. Üblich sind z.B. der 20% und 
der 80% Punkt sowie gegebenenfalls auch noch der 50% Punkt?!. Das entspricht 
dann einer Zwei- bzw. Drei-Punkte Repräsentation vowel onset — (midpoint) - 
offset. 

Komplexere Verfahren wenden das mathematische Konzept der orthogonalen 
Funktionen an. Dieses erlaubt — unter gewissen Umständen - eine beliebige Funk- 
tion bzw. eine Folge von Messwerten durch eine gewichtete Summe von bestimm- 
ten einfachen Funktionen darzustellen oder zu approximieren (Hochstrasser 1965, 
790). Die Gewichte in der Summe bilden dann den gesuchten Parametersatz. Ein 
gern verwendetes Verfahren aus dieser Klasse ist das der diskreten Kosinus-Trans- 
formation, discrete cosine transformation (DCT), nach Ahmed u.a. (1974). Die 
DCT nutzt als orthogonale Funktion den Kosinus und ist ein rein reelzahliger Ver- 
wandter der diskreten Fourier Transformation”. Die DCT entstammt ursprünglich 
der Bildverabeitungsalgorithmik und wird weiter unten mathematisch detailliert. 
Als Verfahren zur Parametrisierung von Formantbahnen findet die DCT erstmalig 
in Zahorian/Jagharghi (1993, 1970) und Watson/Harrington (1999, 461) Verwen- 
dung?”. Neuere Anwendung der DCT-Formantbahnparametrisierung finden sich 
z.B. bei Williams/Escudero (2014, 2754). Eine dynamische Beschreibung kann 
besser als eine statische sein. Schon Strange u. a. (1976, 221) vermuten: „From the 
standpoint of perception, it would seem that the definition of a vowel ought to 
include a specification of how the relevant acoustic parameters change over time“. 
Weitere Texte, die jeweils unterschiedliche Verfahren gewählt haben, Formant- 
bahnen dynamisch darzustellen, kommen zu ähnlichem Ergebnis. So etwa finden 
Hillenbrand u.a. (1995, 3109) in einer Studie: „The vowels of American English 


1 Arbeiten mit diesem Ansatz in Auswahl: Harrington/Cassidy (1994, 360), Hillenbrand u.a. 
(1995, 3107) und Fletcher u.a. (2015, 2134). 

3?Mathematisch fallen die Kosinusfunktionen in ihrer in der DCT verwendeten Form in eine 
Klasse der Tschebyscheff-Polynome, welche orthogonale Funktionen sind (Ahmed u.a. 1974, 90). 

33 Verwandt ist die Nutzung der DCT zur Repräsentation von Amplitudenspektren. Dann ent- 
sprechen die DCT-Parameter den sogenannten Mel-Cepstralkoeffizienten (Deller u.a. 1992, 380- 
385). Diese sind hier dann jedoch statische und nicht dynamische Größen. Allerdings kann jeder 
so mittels DET gewonnene statische Mel-Cepstralkoeffizient durch eine zweite anschließende 
DCT über den Zeitlauf als dynamische Cepstralkoeffizientenbahn dargestellt werden, so etwa bei 
Zahorian/Jagharghi (1991, 2981). 
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are more appropriately viewed not as points in phonetic space but rather as trajec- 
tories through phonetic space“. Hillenbrand u.a. (2001, 760) schreiben: „Pattern 
recognition models that were trained on formant trajectories separated vowels with 
consistently greater accuracy than otherwise comparable models that were trained 
on static formant patterns“. 

Im Allgemeinen stellt sich heraus, dass eine dynamische Beschreibung eine 
Verbesserung liefert. Dies betrifft insbesondere spezielle Einzelfälle, so etwa bei der 
Unterscheidung gespannter und ungespannter Vokale im australischen Englisch, 
wo das Formantziel für erstere eher erreicht wird (Watson/Harrington 1999, 465). 
Die Unterschiede sind allerdings oft gering. Die Hauptinformation ist nach wie 
vor in den Formantzielwerten zu suchen: „|...] although there is clear evidence for 
the presence of dynamic information that benefits vowel identification, the results 
[...] are entirely compatible with a target theory of vowel identification“ (Watson/ 
Harrington 1999, 465). Ebenso merken Zahorian/Jagharghi (1993, 1979-1980) an: 
„[...] for monophthongal vowels |...] static spectral cues are more important than 
temportal cues. |...| however, feature trajectories are important secondary sources 
of information“. 


3.3.3.1 Ergänzung: Discrete Cosine-Transformation (DCT) 


Dieser Ergänzungsabschnitt enthält eine mathematische Beschreibung der diskre- 
ten Kosinus-Transformation, die für nicht mathematisch Interessierte übersprun- 
gen werden kann. 


Mathematischer Einschub: Die DCT stellt sich nach Ahmed u.a. (1974) wie 
folgt dar: Der k-te DCT-Koeffizient G|k] einer Folge F[t| von Werten - z.B. einer 
Formantbahn - ist definiert als 


G[k] = SF cs (7 (&-1) (t- 5)) | (1) 


t=1 


Dabei gilt für k und t jeweils der Bereich 1...T°*. Diese Transformation der Folge 
Fit] auf die Folge G[k] wird als DCT-II-Transformation bezeichnet und erfolgt 
im VOKALJÄGER mit R (Komsta 2007). Eine besondere Bedeutung hat der erste 
DCT-Koeffizient 


mit k = 1, wodurch der Kosinusterm 0 wird. Der DCT-Koeffizient G|1] ist also 
nichts anderes als der Mittelwert ur der Reihe Ft]. Die ursprüngliche Folge Ft] 


34In dieser Notation zählt der Index t die Proben des Lautsegments von 1 bis T. Der Übergang 
auf relative Zeit von 0 bis 1 ist einfach Skalierung mit = /r - ı. 
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Abbildung 14: Die DCT wird aus Kosinusfunktionen zusammengesetzt. Hier dar- 
gestellt ist die Kosinusfunktion, die der DCT erster Ordnung (Kl: K = 1), zweiter 
Ordnung (K2: K = 2) und dritter Ordnung (K3: K = 3) unterliegt. Die x-Achse ist 
in der Einheit r, was hier äquivalent zur relativen Lautdauer t im Lautsegment ist 
(t = 0, links, ist Beginn des Segments; t = 1, rechts, ist Ende des Segments). Der 
Kosinus der DCT erster Ordnung (K1) ist eine Konstante und entspricht dem Mit- 
telwert. Der Kosinus der DCT zweiter Ordnung (K2) kann eine Bewegung von einem 
Extrem (hier: Maximum) zum anderen (hier: Minimum) darstellen. Der Kosinus der 
DCT dritter Ordnung (K3) kann zusätzlich noch die Rückkehr zum Ursprungsextrem 
abbilden (hier: Maximum — Minimum - Maximum). Die im VOKALJÄGER angesetz- 
te DCT dritter Ordnung ist dann eine gewichtete Kombination der drei Kosinuse K1, 
K2 und K3. 


lässt sich aus allen Koeffizienten G|k] wieder vollständig mit der inversen DCT- 
Transformation (oder: DCT-Ill-Transformation) 


Fi] = [1] +2 ch > (7 “-, ( . ;)) 


rekonstruieren”. Die ursprüngliche Folge wird also aus Kosinustermen ansteigen- 
der Ordnung ‚zusammengesetzt‘. Die Kosinusterme bis zur Ordnung k = 3 sind in 
Abbildung 14 auf S. 59 gezeigt. 

Verwendet man bei der Rekonstruktion nicht alle T Koeffizienten G[k], sondern 
schränkt sich auf eine geringere Zahl2< K <T ein, erhält man die Approximation 


Fk] =clıl+2 ch cos e (k-1) (i u s)) z Fit] (3) 


?5Die hier für den VOKALJÄGER angesetzte Formel ist eine bewusste Umschreibung der For- 
meln (1) und (6) aus Ahmed u.a. (1974, 90-91) an zwei Stellen. Zum einen läuft hier der Index 
von 1 bis 7’, im Original von O0 bis T — 1. Daraus ergibt sich ein -/ in der Klammer anstatt 
eines +1. Zum anderen wurden hier die Faktoren so umgeschrieben, dass G|1] einen Faktor von 
1 erhält anstatt des originalen 2. Nur so ergibt sich G]1] als Mittelwert über Ft], was für die 
Anwendung vorteilhaft ist. 
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von Ft]. Die Anzahl K der verwendeten Koeffizienten ist die Ordnung der Nähe- 
rung und man spricht von einer Näherung der Ordnung K°°. Die Näherung erster 
Ordnung, also mit K = 1, ergibt sich mit Formel (2) zu 


F"[] = GI1] = ur. (4) 


Damit wird Ft] in einer Näherung erster Ordnung mit dem mittleren Wert von Ft] 
approximiert, was anschaulich sofort einleuchtet. Die Näherung zweiter Ordnung 


ergibt sich zu 
T 1 


2 

Fit] = ur + 2G/2] cos (= (i — 5)) 
was den Mittelwert mit einem halben Kosinuszyklus überlagert (das Kosinusargu- 
ment läuft von knapp über O0 beim Index t = 1 bis knapp a beit=T;; vgl. Abbil- 
dung 14 auf S.59). Eine Näherung zweiter Ordnung kann somit zusätzlich einen 
Übergang von einem hohen auf einen tiefen Wert darstellen (oder umgekehrt). Ei- 
ne Näherung dritter Ordnung addiert einen vollen Kosinuszyklus als dritten Term 
(das Kosinusargument läuft von 0 bis knapp 2 r; vgl. Abbildung 14 auf S.59). 
Nun sind bogenförmige Formen, die ein intermediäres Maximum (oder Minimum) 
erreichen, abbildbar: 


F’ft] = ur +2G]] cos (= (e- ;)) H2GI[3] cos (7 (t- 5)) (5) 


Mit noch höherer Ordnung K ergeben sich immer genauere Darstellungen der 
Folge Ft] (vgl. auch Abbildung 14 auf S.59, die die der DCT zugrundeliegenden 
Kosinusterme aufzeigt). 

Als Maß für die Güte einer einzelnen Näherung der Ordnung K bietet sich der 
relative Fehler 


10 log er 2 FE - er) (6) 


an (logarithmiert in db). Diese hier als (einzelner) Passfehler bezeichnete Größe 
misst die relative Abweichung einer einzelnen approximierten Bahn F*[t] von der 
originalen Bahn Ft]. Dazu wird der absolute Abstand zwischen dem originalen 
Messwert F[t] und der Näherung F*[t] bestimmt, aufsummiert, und mit dem Mit- 
telwert jur und der Anzahl Messwerte T normiert?’. Im VOKALJÄGER wird ein 


»6Hijer wird die Anzahl K der Parameter als Ordnung bezeichnet. Leicht abweichend ist z.B. 
Williams/Escudero (2014, 2754), die die Koeffizientennummerierung mit k = 0 beginnen und 
eine DCT-Näherung mit drei Koeffizienten als second order bezeichnen. 

37Für die Definition des Abstandmaßes existieren verschiedene Verfahren und hier wurde aus 
Gründen der technischen Praktikabilität und Robustheit ein gegenüber starken Schwankungen 
einfaches und lineares gewählt. Ähnlich dem hier gewählten ist die local cost Funktion in Za- 
horian/Jagharghi (1993, 1980). Denkbar wäre hier auch ein gemittelter perzeptuell spektraler 
Abstand zwischen zwei Vokaltraktfiltern, das eine definiert durch die gemessenen Formanten 
F,|t|, das andere durch die approximierten FK [{], berechnet mit einem Itakura-Saito-Maß, vgl. 
z.B. Benesty u.a. (2008, 122). 
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(totaler) Passfehler als Summe der Einzelfehler über die ersten drei Formanten 
j=1...3 mit 


e= 10 log 2 En 3 FA ru) (7) 


angesetzt, wobei der Logarithmus in die übliche Darstellung in dB überführt. Ende 
des mathematischen Einschubs. 


Schaubild 15 auf $.62 veranschaulicht die Anwendung einer DCT°®. Dargestellt 
ist eine gemessene F1-Formantbahn als auch die Näherung nach Formel (3). Die 
Näherung wird dabei mit unterschiedlichen Ordnungen K errechnet, die von 1 bis 
9 reichen. Schaubild 16 zeigt den dazugehörigen Passfehler nach Formel (6). Die 
dazugehörigen neun DCT-Koeffizienten ergeben sich (auf zwei Stellen Genauigkeit 
und eine Nachkommastelle gerundet) zu: 


k v3 34 5 6 789 
GIk] 710,0 24,0 -80,0 5,8 -17,0 23 -15,0 0,6 4,1 


In erster Ordnung, K = 1, wird die Kurve, offensichtlich zu ungenau, nur durch 
ihren Mittelwert abgebildet: Die Approximation ist eine einfache horizontale Linie 
an der Frequenz G[1] = ur = 710 und der Passfehler beträgt ungefähr —8dB. 
Mit zunehmender Ordnung wird die Approximation der Formantbahn genauer, 
was sich auch in einem sinkenden Passfehler zeigt. Der Übergang von Ordnung 
K = lauf K = 2 verbessert die Approximation faktisch nur unwesentlich. In 
dritter Ordnung K = 3 ist dann das bogenförmige gekrümmte Wesen der Bahn 
herausgearbeitet und der Passfehler sinkt auf etwa —14dB. 

Ein wichtiger Effekt der Näherung wird deutlich: Die DCT glättet die For- 
mantbahn: Sie ist ein einfaches mathematisches Verfahren „to produce smoother 
[formant] trajectories“ (Williams/Escudero 2014, 2754). Näherungen noch höherer 
Ordnung, z.B. mit K = 7, bilden die gemessene Bahn in Feinheiten technisch 
genauer ab und der Passfehler beträgt dann nur noch ca. —18dB. Doch sind so 
herausgearbeitete Feinheiten weniger repräsentativ als eine unerwünschte Nachbil- 
dung von Eigenheiten genau der einen vorliegenden Messung, also eine Überadap- 
tion. 

Wenn nun eine niedrige Ordnung K zu wenig Information und eine hohe Ord- 
nung zu viel Information enthält, stellt sich natürlich die Frage, welche Ordnung 
abschließend in einer Messung zu verwenden ist. Die Formantbahn eines Lauts 
ist das Ergebnis eines sich bewegenden Artikulationsapparates, wenn dieser Laut 
gebildet wird. Welche Bewegungen sind zu erwarten und welche sind mit den Kosi- 
nusfunktionen der DCT abzubilden (vgl. hierzu nochmals Abbildung 14 auf S. 59, 
die die der DCT zugrundeliegenden Kosinusterme aufzeigt)? Eine Näherung ers- 
ter Ordnung entspricht einem vollkommen statischen Vokaltrakt; eine Näherung 


?8Sprecherin K10 des Kiel-Korpus, Marburgsatz MR28; [a:] in vertragen. 
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0 50 100 0 50 100 0 50 100 
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Abbildung 15: Dargestellt ist eine gemessene F1-Formantbahn, wobei je ein grauer 
Kreis einen Messwert darstellt. Die durchgezogenen Linien sind DCOT-Näherungen 
der Ordnung K, wobei K von 1 auf 9 ansteigt. Die DCT Ordnung K ist über dem 
Diagramm angezeigt. Mit zunehmender Ordnung K schmiegt sich die DTC Näherung 
den Messwerten immer mehr an. Die Formantbahnen werden geglättet. Mit der DCT 
Ordnung K = 3 lässt sich die wesentliche Form der Formantbahn reproduzieren. 
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1.2 


34586789 
Ordnung K 


Abbildung 16: Für die DCT-Näherungen aus Schaubild 15 auf S.62 sind hier die 
entsprechenden Passfehler nach Formel (6) von S. 60 in Abhängigkeit der Ordnung K 
aufgetragen. Mit zunehmender Ordnung K sinkt der Passfehler von -8dB auf -18dB. 


zweiter Ordnung einem Vokaltrakt, der sich in einem Halbbogen von einer in einer 
Richtung extremen Stellung zu einer in umgekehrter Richtung extremen Stellung 
bewegt; eine Näherung dritter Ordnung erlaubt in einem Bogen das Erreichen einer 
Extremstellung ausgehend von und zurückkehrend auf eine Normalposition. 

Diese drei Möglichkeiten sind - in Moderation und Kombination — die im We- 
sentlichen zu erwartenden Konstellationen innerhalb eines Lauts. Sie entsprechen 
den Basisbewegungen der Artikulation. Diese Überlegung rechtfertigt die Verwen- 
dung der maximalen Ordnung K = 3. Mathematisch-technisch bedeutet eine nied- 
rige Ordnung K, dass nur niederfrequente Anteile der Formantbahn erhalten blei- 
ben: Nur eine sich langsam ändernde - also niederfrequente — Formantbahn ver- 
bleibt in der Approximation. Aber genau das wird erwartet, denn der menschliche 
Artikulationsapparat ist physikalisch träge. Der schnellste Teil, die Zunge, bewegt 
sich maximal mit 2 cm/s, was etwa 8 Silben pro Sekunde entspricht (Honda 2008, 
22). „From frame to frame |...] the formants generally change slow]y. |...] The ma- 
ximum rate of change for a formant is approximatly 20 Hz/ms“ (O’Shaughnessy 
2008, 224). Im VOKALJÄGER wird die Balance zwischen unerwünscht ungenauen 
Näherungen niedriger Ordnung und ebenso unerwünscht übergenauen Näherungen 
bei K = 3 angesetzt, was den Literaturwerten in etwa entspricht: Watson /Har- 
rington (1999, 463) setzen z.B. K = 2 und Zahorian/Jagharghi (1993, 1976) sowie 
Williams/Escudero (2014, 2754) setzen K = 3. 

Wünscht man die hier vorliegende exemplarische Formantbahn mit drei Para- 
metern zu parametrisieren, wählt man dazu die ersten drei DCT-Koeffizienten. Der 
Parametersatz (G|1];G]2];G[3]) = (710; 24; —80) beschreibt die in Schaubild 15 auf 
S.62 unter K = 3 dargestellte glatte bogenförmige Näherungskurve vollständig. 

Allerdings sei an dieser Stelle darauf hingewiesen, dass nachgelagerte Verfah- 
ren wie die (robuste) Normalisierung für DCT-Parameter sehr komplex sind und 
zurzeit noch nicht im VOKALJÄGER implementiert sind (vgl. Abschnitt 3.5.8 ab 
S.82). Deshalb wird vorerst die DCT im VOKALJÄGER nur zur automatischen 
und robusten Bestimmung optimaler Formantzielwerte eingesetzt (vgl. Abschnitt 
3.3.4 ab S. 64 zur Methode). 
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Das Verfahren des Glättens mittels einer DCT lässt sich nicht nur auf For- 
manten anwenden, sondern auf alle Parameter, deren Bahnen von sprunghaften 
Bewegungen befreit sowie auf einfache Basisformen reduziert werden sollen. Eine 
naheliegende Anwendung sind die Bandbreiten. Nicht unerwähnt soll auch blei- 
ben, dass die DCT nicht der einzige Parametrisierungsansatz und nicht die einzige 
Methode zur Glättung von Messwertkurven ist. Nance (2013, 113) wendet z.B. 
die sogenannte spline interpolation an. Der Fundamantalunterschied zur hier an- 
gesetzten DCT ist, dass keine Grundformen, wie Bögen, angesetzt werden, sondern 
nur eine Glättung angestrebt wird. 


3.3.4 Optimale Formantbahnen 


Das bisher Geschriebene basiert auf einer stillschweigend gemachten Grundan- 
nahme: Es ist grundsätzlich möglich, einen Formanten genau zu messen. Oder, 
anders formuliert: Das Ergebnis einer Messung ist eine eindeutige Formantbahn, 
aus der der gesuchte Formant genau ablesbar ist. Das ist in der Realität allerdings 
leider nicht der Fall. Die Formantmessung in der Praxis ist ein komplizierter Pro- 
zess. Unterschiedliche Messverfahren liefern unterschiedliche Ergebnisse. Die auch 
im VOKALJÄGER verwendete De-facto-Standardsoftware für Formantberechnung, 
PRAAT, z.B. verlangt insbesondere die Einstellung eines Frequenzbereichs, in dem 
nach einer vorgegebenen Anzahl von Formanten numerisch ‚gesucht‘ wird. Abhän- 
gig von diesen Stellwerten erhält man unterschiedliche Suchergebnisse, die mal 
mehr, mal weniger plausibel erscheinen. 

Abbildung 17 auf S. 65 zeigt exemplarisch mit PRAAT berechnete Formantbah- 
nen für einen weiblichen Sprecher”. Hierbei durchlief der wesentliche Stellwert — 
die obere Grenze des zu durchsuchenden Frequenzbereichs — Werte von 4.000 bis 
5.900 Hz. Andere Stellwerte verblieben fix auf ihren Standardwerten. Alternativ 
hätte man auch den Frequenzbereich fixieren und die Anzahl der zu findenden 
Formanten variieren können. Dieses Vorgehen weist aber weniger Spielraum auf. 
Auch ist es prinzipiell möglich, die anderen nachrangigen Parameter gegebenenfalls 
auch kombiniert zu variieren. Doch für dieses Beispiel und die Implementierung 
im VOKALJÄGER ist davon vorerst abgesehen worden. 

In einem Bereich von etwa 4.400 bis 4.700Hz als Obergrenze erscheinen die 
Formantbahnen stetig. In Bereichen unterhalb von 4.400 Hz, aber auch oberhalb 
von 4.800 Hz, sind zum Teil heftige Sprünge zwischen den Bahnen zu beobachten. 
Dies erklärt sich darin, dass PRAATs Algorithmus hier z.B. nach F2 sucht (die 
mittlere Bahn), aber F1 (die untere Bahn) findet. Das ist aber nur für Einzelwerte 
der Fall, die Nachbarwerte reihen sich stetig. Dieses sprunghafte Verhalten ist aber 
aufgrund der Trägheit der Anatomie des Sprechapparates nahezu ausgeschlossen. 


#9Sprecherin K10MR. des Kiel-Korpus: [a] in verlassen; Satz 82; Ausschnitt des 60% Zentrums. 
PRAAT Parameter: Zielsuche nach 5 Formanten; Burg Algorithmus; 2 ms Fensterversatz; 25 ms 
Fensterlänge; Gauß-Fenster; Präemphase ab 50Hz; Sound: To Formant Burg(Boersma/Weenink 
2015). 
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Abbildung 17: Formantbahnen, die in PRAAT berechnet wurden. Hierbei wurde 
PRAAT angewiesen, nach jeweils 5 Formanten - von denen Fl, F2 und F3 hier 
gezeichnet sind - in einem bestimmten Frequenzbereich zu ‚suchen‘. Die Obergrenze 
des Bereichs in Hertz ist den Grafiken übergestellt. Von etwa 4.400 bis 4.700 Hertz 
ergeben sich stetige Verläufe. Das Signal ist [a] in verlassen. 
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Abbildung 18: Die Formantbahnen aus Schaubild 17 auf S. 65, überlagert mit DCTs 
dritter Ordnung (schwarze Kurven). 
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Abbildung 19: Dargestellt ist der DCT-Passfehler in dB in Abhängigkeit der oberen 
Grenzfrequenz (bezogen auf die Formantbahnen aus Abbildung 17). Der Passfehler 
ist in diesem Beispiel in einem Bereich von etwa 4.400 Hz bis 4.700 Hz am geringsten. 


Im Ergebnis ist deutlich zu erkennen, dass die Formantbahnen erheblich variieren. 
Damit variieren folglich auch (vermeintliche) Formantzielwerte, die an einem be- 
stimmten Zeitpunkt aus den Bahnen extrahiert werden. (vgl. Abschnitt 3.3.3.1 ab 
S.61). Hieraus ergibt sich eine Möglichkeit, die Güte der Messung bzw. die Güte 
der Parametrisierung der Messmethode zu beurteilen: Eine Messmethode, die eine 
stetige Formantbahn ergibt, ist einer Messmethode vorzuziehen, die durch Sprün- 
ge zerstückelte oder ruckartig verzerrte Formantbahnen ergibt. Anders herum: Die 
Formantbahnen müssen „continuity constraints“ gehorchen (O’Shaughnessy 2008, 
223-225). 

Mit diesem Ansatz wird das Problem umgangen, dass sich für die üblichen 
Standardwerte — 5.000 Hz für männliche und 5.500 Hz für weibliche Sprecher als 
Obergrenze in PRAAT - nicht notwendigerweise kontinuierliche Bahnen ergeben. 
Wenn die Bahnen, die kontinuierlich sind bzw. sein sollen, algorithmisch bestimmt 
werden können, ist eine automatisierte Lösung für eine Aufgabe gefunden, die oft 
händisch gelöst wird: das Adjustieren des Messverfahrens, um sinnvolle Formant- 
werte zu erhalten. Watson/Harrington (1999, 461) vermerken noch, dass „appro- 
ximately one third of all vowels required some hand correction“. In dem Einfüh- 
rungstext von Thomas (2010, 43) heißt es lapidar: 


„In fact, you should probably expect to adjust the number of coeflicients of formants con- 
stantly in order to get the most accurate formant frequencies for every token you measure. 
[...] I it appears that you’ve obtained a bad reading, adjust the number of LPC coefficients 
and measure it again.“ 


Doch wie lässt sich dies in einem automatischen Messprozess fassen? Die Antwort 
liegt in der DCT, der Diskreten Kosinus-Transformation aus Abschnitt 3.3.3 ab 
S.56. Eine Formantbahn, die mit einer DCT-Näherung dritter Ordnung geglät- 
tet ist, kann nur Bogen- und Halbbogenformen annehmen — und genau nur die- 
se Formen korrespondieren mit den Basisbewegungen des Artikulationsapparates. 
Die optimale Formantbahn bzw. die optimale Wahl des Messverfahrens und der 
Messparameter, die diese ergeben, ist also jene, die mit dem Artikulationsapparat 
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Abbildung 20: Mit der oberen Grenzfrequenz von 4.500 Hz bestimmte Formant- 
bahnen für F1, F2 und F3 sind für [a] in das Spektrogramm gezeichnet. Die Bahnen 
(weiß) liegen tendenziell im Bereich hoher Spektralenergie (dunkle Färbung) bzw. 
nicht im Bereich niedriger Intensität (helle Färbung). 


kompatibel ist. Dabei wird der Artikulationsapparat bzw. seine Beweglichkeit und 
Trägheit durch eine DCT approximiert, die nur bestimmte Veränderung zulässt. 
Wenn man nun solche DCT-Näherungen den originalen Messungen überlagert, ist 
die Genauigkeit, mit der die Näherung die Messung approximieren kann, ein Maß 
für die Güte der Messung. 

Dies soll nun zuerst exemplarisch erläutert werden. Schaubild 18 von S.66 
stellt die Formantbahnen aus Abbildung 17 auf S.65 dar, überlagert mit DCT- 
Näherungen dritter Ordnung. Errechnet man nun ein Fehlermaß für die Güte der 
Näherung mit Formel (6) von $.60, ergibt sich Schaubild 19 auf S. 67%. Deutlich 
ist zu erkennen, dass der Fehler in einem Bereich um etwa 4.500 Hz am niedrigsten 
ist. Ebenso liegt ein niedriger Fehler - wenn auch nicht ganz so niedrig - in einem 
Bereich um etwa 5.500 Hz vor. Dies korrespondiert anschaulich mit Darstellung 18 
auf S.66: Mit diesen Stellwerten findet man stetige Kurven. 

Ein weiterer intuitiver Zugang für die Güte der Approximation - bzw. die aus- 
gewählte Formantbahn - ist ein Vergleich mit dem Spektrogramm der Äußerung. 
Schaubild 20 auf S.68 zeigt das Spektrogramm für verlassen. Für die Kernregion 
von [a] sind Formantbahnen überlagert. Diese wurden mit einer Grenzfrequenz von 
4.400 Hz bestimmt, die nach der Fehlerkurve aus Bild 19 auf S.67 im optimalen 
Bereich liegt. Die Formantbahnen korrespondieren im Wesentlichen mit den Spek- 
tralmaxima, die durch die dunklen Bereiche angezeigt werden. Insbesondere ist aus 
dem Spektrogramm kein Absinken der Spektralenergie von Fl zum Ende von [a] 


Dargestellt ist allerdings hier eine Erweiterung von Formel (6) in der endgültigen Form der 
VOKALJÄGER Implementierung. Siehe dazu Formel (33) auf S. 105. 
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ersichtlich. Dies wäre gemäß Bild 18 auf S. 66 aber z.B. für eine mit Grenzfrequen- 
zen um 5.5200Hz bestimmte Formantbahn zu erwarten gewesen: Damit kann die 
Grenzfrequenz von exakt 5.500 Hz, die ja dem Standardwert für Frauen entspricht, 
im vorliegenden Fall als unbrauchbar verworfen werden. 

In der Literatur finden sich einige Arbeiten, die sich mit der Thematik der op- 
timalen Formantbahn bzw. des optimalen Messverfahrens beschäftigen. Die erste 
Arbeit, MceCandless (1974), nutzt dynamische Programmierung und wird eben- 
so in Zahorian/Jagharghi (1991) verwendet. Bei Zahorian/Jagharghi (1993, 1980) 
erscheint eine Variation, die einen „lowest-cost path among the set of formant 
candidates“ bestimmt. Escudero/Boersma (2009, 1382) nutzen PRAAT zur Opti- 
mierung: „[to] optimize the formant ceiling“ — ihr Algorithmus sucht die Varianz 
der gemessenen Formanten(paare) zu minimieren. 

Die vollumfänglich mathematisch-technische Beschreibung des Optimierungs- 
algorithmus des VOKALJÄGERS findet sich erst in Abschnitt 3.7 ab S. 103, wobei 
einige erst noch zu beschreibende Verfahren zusätzlich zum Einsatz kommen. Die 
Kernidee des Algorithmus sei aber schon an dieser Stelle kurz umrissen: Es werden 
für verschiedene obere Grenzfrequenzen im Bereich zwischen 4.000 Hz und 6.000 Hz 
systematisch die ersten drei Formantbahnen in einem PRAAT-Skript vollautoma- 
tisch errechnet. Darauf erfolgt mittels der Statistiksoftware R eine Berechnung der 
jeweiligen DCT-Näherungsbahnen dritter Ordnung. Es wird dann der Satz von For- 
mantbahnen - bzw. die obere Grenzfrequenz - als optimal ausgewählt, die sich am 
besten durch Näherungsbahnen approximieren lassen. Das sind jene Bahnen, deren 
Passfehler nach Formel (7) von S.61 am geringsten ist. Damit wird also dem Satz 
von Formantbahnen der Vorzug gegeben, die den artikulatorischen Kontinuitäts- 
bedingungen am ehesten Genüge tun. Weitere eher technische Zusatzbedingungen 
werden dabei ebenfalls berücksichtigt. Damit ist ein Mechanismus geschaffen, der 
dynamisch adaptiv den Stellwert der oberen Grenzfrequenz in PRAAT bestimmt. 
Die sich numerisch ergebenden oberen Grenzfrequenzen werden dann in Abschnitt 
4.2.3 ab S. 117 dokumentiert. 


3.3.5 Bestimmen der Formanten aus der Formantbahn 


Eine direkte Anwendung der optimalen Formantbahn aus Abschnitt 3.3.4, S. 64f., 
ist die stabile Bestimmung des Formantzielwerts. Die DCT-Formantbahn folgt den 
Messwerten, ist aber in ihrer Form einfach und geglättet. Somit ergibt sich eine 
einfache Methode, die Formantzielwerte zu bestimmen: Anstatt den Formantziel- 
wert aus der gemessenen Formantbahn abzulesen, kann er aus der DCT-geglätteten 
Formantbahn bestimmt werden. Schaubild 21 auf S.70 veranschaulicht das Vor- 
gehen. Das Ablesen der Zielwerte aus DCT-geglätteten Kurven wird in einigen 
Publikationen verwendet. Zahorian/Jagharghi (1991, 69) wenden z.B. eine DCT 
dritter Ordnung an, bevor sie Formanten am %-Punkt extrahieren. 

Abhängig von der oberen Grenzfrequenz ergeben sich so verschiedene abge- 
lesene Formantzielwerte, was in Abbildung 22 auf S.70 dargestellt ist. Welcher 
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Abbildung 21: Extraktion des Formantzielwerts aus einer Formantbahn durch Ab- 
lesen am Zeitmittelpunkt, angezeigt durch die vertikalen Linie (Dargestellt ist die 
Zentralregion der Abbildung 15 von $S.62, K = 3). Der Messwert kann entweder aus 
der originalen Formantbahn abgelesen werden (gestrichelte horizontale Linie) oder 
aus der geglätteten DCT-Approximation dritter Ordnung. Der Zeitmittelpunkt ist 
leicht exzentrisch zum Scheitelpunkt der DCT-Kurve. 
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Abbildung 22: Formantzielwerte, die aus Schaubild 17 von S.65 abgelesen wurden. 
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Zielwert ist nun aber der richtige? Es ist der, der aus der optimalen Formantbahn 
abgelesen wird. Damit löst der VOKALJÄGER zwei Probleme. Zum Ersten wird 
durch Passtests der DCT-Formantbahnen an die Messergebnisse der optimale Pa- 
rametersatz — und so optimale Formantbahnen — bestimmt (der VOKALJÄGER 
variiert zurzeit nur einen Parameter, die obere Grenzfrequenz, doch andere kön- 
nen dem Verfahren zugefügt werden). Zum Zweiten erlauben DCT-Formantbahnen 
ein verlässliches Ablesen von Formantzielwerten, denn durch die DCT wird sicher- 
gestellt, dass der abgelesene Wert den artikulatorischen Kontinuitätsbedingungen 
der Formanten genügt. 
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3.4 Ergänzung: Andere Größen 


3.4.1 Grundfrequenz FO 


Die Grundfrequenz (fundmental frequency; pitch; harmonic) abgekürzt FO oder 
H1, ist die Frequenz der Stimmbandschwingung. Es ist die Pulsfrequenz des Luft- 
stroms, der durch den Artikulationstrakt strömt, wenn dieser einen Vokal formt 
und einen betonten Laut erzeugt (Deller u.a. 1992, 159). Die Grundfrequenz hat 
starke Obertöne, die das Spektrum überlagern und mit H2, H3 usw. bezeichnet 
werden. Ihre Kernbedeutung liegt in der Betonung bzw. Prosodie (prosody; in- 
tonation; tone; word stress). Darüber hinaus gilt sie als sekundäres Merkmal zur 
Vokalunterscheidung. „For instance, high vowels tend on average to show higher FO 
than lower vowels“ (Thomas 2010, 31). Darüber hinaus existieren Normalisierungs- 
verfahren, die die Grundfrequenz einbeziehen. So ist z.B. das erste Syrdal-Delta, 
welches auch im VOKALJÄGER verwendet wird, die Differenz von F1 über FO (vgl. 
Abschnitt 3.5.5 ab S.81). 

Zur Messung der Grundfrequenz existiert eine Vielheit von Methoden, die auf 
der überlagernden Periodizität der Stimmbandanregung basieren. Der VOKALJÄ- 
GER nutzt mit PRAAT die dort implementierte robuste Variante der Autokorrela- 
tionsmethodet!. 


3.4.2 Intensität 


Die Intensität misst die Energie oder Stärke des Lautschallsignals pro Zeiteinheit. 
Diese kann z.B. zur Unterscheidung betonter und unbetonter Vokale genutzt wer- 
den. Üblicherweise wird sie aus dem Lautschallsignal s[r| mit 


Iolt] = 10 log (5 Duflsir) (8) 


errechnet und wird als logarithmierte Energie in dB notiert (Atal/Rabiner [1976, 
202] und Deller u. a. [1992, 246]). Dabei läuft 7 über den Zeitausschnitt der Länge 
D und w[r] ist eine Fensterfunktion, um Randeffekte abzudämpfen. Der VOKAL- 
JÄGER nutzt mit PRAAT die dort implementierte Methode to Intensity, die ein 
Gaußfenster für w|t] ansetzt (Boersma/Weenink 2015). Im VOKALJÄGER wird im 
Lautsegment der Länge 7’ durch Mittelung die endgültige Intensität mit 


an oh (9) 


17u den Details sei hier auf die Literatur verwiesen (Rabiner/Schafer [1978, 372 und 447], 
Deller u.a. [1992, 241, 261, 333 und 366] und Hess [2008]). Ein technisches Problem ist, dass bei 
der Messung oft Lücken entstehen. Der VOKALJÄGER nutzt den in R implementierten impute- 
Algorithmus von Honaker u.a. (2014),um diese zu schließen. 
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errechnet und um eine akkumulierte totale Intensität 
T=) It] (10) 
t 
ergänzt, welche ein energiegewichtetes Zeitmaß darstellt. 


3.4.3 Lautdauer 


Die Zeitdauer des Vokals ist offensichtlich primäres Unterscheidungsmerkmal zwi- 
schen langen und kurzen Vokalen. Gleichbedeutend mit der Messung der Vokal- 
länge gilt es, den Zeitpunkt des Vokalansatzes und Vokalendes zu bestimmen, also 
das Signal hinsichtlich der Vokale zu segmentieren. Dies wiederum bedeutet, je- 
nen Zeitraum zu bestimmen, in dem das Sprachsignal betont ist. Es existiert eine 
Vielzahl von Methoden zur automatisierten Segmentierung, auf die hier nur im 
Auszug verwiesen sein soll: Atal/Rabiner (1976) und Hoang/Wang (2015). Vollau- 
tomatisierte Vokalsegmentierung stand nicht im Vordergrund des VOKALJÄGERS. 
Daher wird für die Zeitdauer auf explizite Segmentierung des Lautschallsignals zu- 
rückgegriffen. Für manche Daten sind diese von Experten durchgeführt und somit 
verlässlich (insbesondere für das Kiel-Korpus, vgl. Abschnitt 4.1.2 ab $. 113). Für 
andere sind die Segmentierungen vom Autor manuell durchgeführt und daher nur 
indikativ. 


3.4.4 Ausblick auf weitere Größen 


Die bisher beschriebenen akustischen Größen sind bei weitem nicht vollumfänglich, 
wohl aber völlig ausreichend. Weitere Größen fanden jedoch aus Zeitgründen keinen 
Eingang in den VOKALJÄGER und werden im Lauf der Zeit nachgereicht. 

Besonders interessant sind sogenannte Vollspektrum-Ansätze. Hier versucht 
man nicht das Spektrum mit einem (Linear Predietion LP) Modell darzustellen, 
sondern bildet das Spektrum in seiner Gesamtheit ab. In der Regel wird dabei das 
Spektrum in bestimmten Frequenzbändern gemessen, geglättet (z.B. mit einer 
DCT) und parametrisiert (z.B. mit den principal components). Die insbesonde- 
re in der Sprachcodierung verwendeten Mel frequency cepstral coefficients MFCC 
fallen in diesen Bereich. Der Vorteil liegt auf der Hand: Es gibt bestimmte Arti- 
kulationskonstellationen, bei denen das lineare LP-Modell versagt. Hierzu gehören 
insbesondere nasale bzw. nasalierte Vokale. Nachteil sind die zum Teil sperrigen 
Parametrisierungen, die wenig intuitiv zugänglich sind und insbesondere schwer 
als Bahn anzusetzen oder zu normalisieren sind®*. 


#2]n Auswahl einige Arbeiten, die den Vollspektrum-Ansatz nutzen: Plomp u.a. (1966), 
Klein u.a. (1970), Nossairand/Zahorian (1991), Zahorian/Jagharghi (1991), Zahorian/Jagharg- 
hi (1993) und Harrington (2013, 113). Im Einzelnen zu MFCC: Deller u.a. (1992, 380); und: 
Hattori/Fujimura (1958), Fujimura (1962), Krakow u.a. (1988), Qi (1992) und Pruthi (2007) zu 
Nasalen. 
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3.5  Formantnormalisierung 


3.5.1 Über Normalisierung 


Es ist eine große Herausforderung, dass das Lautschallsignal und die daraus ermit- 
telten akustischen Messwerte Informationen enthalten können, die phonetisch und 
phonologisch irrelevant sowie gegebenenfalls grob verfälschend sind. Ebenso mag 
der Wertebereich oder die Verteilungsstatistik verzerrt sein. Es stellt sich also die 
Frage nach einem Transformationsinstrumentarium, welches auf die akustischen 
Messwerte angewendet werden muss, bevor diese als akustische Größen in einem 
Klassifikationsalgorithmus verwendet werden können. Im weiteren Sinne kann man 
die gesuchte Transformation als Normalisierung bezeichnen. Im engeren Sinne sind 
die folgenden Kategorien zu berücksichtigen: 


— Sprechernormalisierung: Beim Sprechakt wird sowohl Information über den 
gesprochenen und klassifikationsphonetisch abstrakten Laut als auch Informa- 
tion über den Sprecher bzw. seinen Vokaltrakt in dem Lautschall gespeichert 
(vgl. dazu im Allgemeinen Ladefoged/Broadbent 1957). Wie Pisoni (1996, 11) 
schreibt: Zum einen enthalten sind die „linguistic properties of speech that 
carry the speaker’s intended message“, zum anderen die „indexical features 
of the signal that provide information about the talker’s voice“. Es ist also 
die Information über den Sprecher aus dem Lautschall bzw. dem abgeleite- 
ten Lautsignal herauszurechnen. Dies ist im Idealfall dergestalt durchzuführen, 
dass die Information über den abstrakten Laut in all seinen (phonetischen, 
prosodischen, soziophonetischen, dialektalen usw.) Elementen prinzipiell erhal- 
ten bleibt. Die Sprechernormalisierung (enger: Vokaltraktnormalisierung) ist 
die wichtigste Transformation (vgl. Abschnitt 3.5.3 ab $. 78). 


— Lineare Wertebereichstransformation: Das Ziel dieser Transformation ist 
es, verschiedene Wertebereiche so linear aufeinander zu skalieren, dass sie in 
derselben Größenordnung liegen. Der Mechanismus der linearen Wertebereichs- 
transformation ist in der Regel das mathematische Mittel, um eine Sprechernor- 
malisierung durchzuführen: Die klassische Z-Wert Transformation (Lobanov- 
Transformation in der Phonetik: vgl. hier Abschnitt 3.5.7 ab S.82) und die 
Bereichsnormalisierung (Gerstman-Transformation in der Phonetik: vgl. hier 
Abschnitt 3.5.6 ab S.81) fallen in diese Kategorie. Eine solche Normalisie- 
rung ist allerdings auch aus rein technischen Gründen unbedingt notwendig. 
So erwarten manche der später im VOKALJÄGER eingesetzten mathematischen 
Klassifikationsverfahren, dass die statistischen Verteilungen der Eingangspara- 
meter einander ähneln und die Wertebereiche von derselben Größenordnung 
sind. Manche fordern gar, dass die Werte zwingend in einem wohl definierten 
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Bereich, etwa zwischen 0 und 1, liegen. Diese Voraussetzung ist z.B. nicht er- 
füllt für die akustischen Messwerte Vokaldauer und erste Formantfrequenz F1*°. 
Hier liegen die Werte der ersten Größe zwischen 0,04 und 0,15 (Sekunden) und 
somit in der Größenordnung 10! bis 10”. Die zweite Größe liegt zwischen 320 
und 700 (Hertz) und somit in der Größenordnung 10°. Eine Wertebereichsnor- 
malisierung beider Werte ist nötig, um einen Größenordnungsunterschied von 
etwa 4 zu eliminieren. 


— Verteilungstransformation und auditorische Skalierung: Die Verteilung 
der Werte mag verzerrt oder unpassend sein. In der Phonetik sucht man z.B. 
durch nicht-lineare (logarithmische) Transformationen die Verteilungscharak- 
teristik auditorischen Maßstäben anzupassen. Als Beispiel betrachte man die 
Formantfrequenzen: Diese werden auf ihrer natürlichen Hertz-Skala gemessen, 
die jedoch ein asymmetrisches Spreizen der Messwerte im höheren Hertzbereich 
aufweist. Die dadurch entstehende nicht-lineare Schiefe der Verteilung kann 
durch eine Transformation auf eine logarithmische Skala ausgeglichen werden. 
Dies ist die einfachste der sogenannten auditorischen Skalierungen (vgl. Ab- 
schnitt 3.6 ab S. 84). 


— Robuste Normalisierung: Die Messung kann unerwartete Werte enthalten, 
die, falls sie Extremwerte sind, leicht die Statistik verzerren können. Eine Nor- 
malisierung muss allgemein dahingehend robust sein. Diese Thematik wird in 
einem separaten Kapitel behandelt (vgl. Abschnitt 3.6 ab S. 84). 


Die folgenden Abschnitte führen die für den VOKALJÄGER relevanten Mechanis- 
men ein, die in den Bereich der Normalisierung fallen. 


3.5.2 Auditorische Skalierung 


Das menschliche Tonhöhenempfinden ist nicht linear. Eine lineare Approximation 
gilt bis etwa 1.000 Hz, darüber ist das Verhältnis eher logarithmisch. Formanten 
werden original als Frequenz F' auf ihrer natürlichen linearen Skala in Hertz [Hz] 
(s”!; cps: cycles per second) gemessen. Es gibt verschiedene Ansätze, sie mittels 
einer Funktion auf eine auditorische Skala (auditory scale) zu transformieren, die 
dem menschlichen Hörempfinden angepasst ist. Im Ergebnis wird im Wesentlichen 
die Spreizung der Messwerte in höherfrequenten Bereichen bereinigt. Übliche Me- 
thoden sind Transformationen auf eine logarithmische Skala, die Bark-Skala, die 
Mel-Skala und die ERB-Skala. Mathematisch handelt es sich um eine Skalierungs- 
funktion n(F), die eine Frequenz F in Hertz auf eine auditorische Skala trans- 
formiert. Diese Transformationen werden streng isoliert auf Formantfrequenzen 
angewendet, wobei dann F\ für Fl, Fa für F2 usw. steht. Flynn/Foulkes (2011, 


43Nachfolgende Zahlenwerte entsprechen gemessenem 10% und 90%-Perzentil über die dem 
VOKALJÄGER zugrundeliegenden Sprachdaten. 
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686) klassifiziert entsprechend die Transformationen auf auditorische Skalen als 
vokalintrinsisch, sprecherintrinsisch und formantintrinsisch. 

Die einfachste Methode ist die der Logarithmischen Transformation. Hier wird 
mit 

Nog(F}) = In(F}) (11) 

die Formantfrequenz F'; logarithmiert (zur Basis e). Gemeinhin üblich ist die Bark- 
Transformation. Sie basiert auf der von Zwicker (1961) vorgeschlagenen Bark- 
Skala. Diese ist eine experimentell bestimmte psychoakustische Skala von Fre- 
quenzbändern und wurde nach Heinrich Barkhausen benannt. Ihr wichtigstes Kenn- 
zeichen ist das Aufspreizen der Frequenzbänder mit ansteigender Frequenz F. Es 
gibt verschiedene, leicht unterschiedliche Approximationsfunktionen (vgl. Anhang 
A.3.3, S.448f.). Im VOKALJÄGER wird die von Zwicker/Terhardt (1980) publi- 
zierte Approximationsfunktion 


F? 
NBark(F}j) = 13 arctan(0,76 F;) + 3,5 arctan e ) =:B, (12) 


verwendet, die die Formantfrequenz F‘; von Kilohertz [kHz] auf die Bark-Skala 
überführt Kranidiotis (1994) gibt die Umkehrfunktion mit 


5 0219 B; en 
BjBark(B5) = 359 +04) Dr=0, 82€ 7 (B5-5)" _ F; 


an. Diese bildet die Formantfrequenz B, in Bark auf ihren Wert F‘; in Kilohertz ab 
Die Unterschiede zwischen den verschiedenen Approximationen der Bark-Trans- 
formation sind geringer als der statistische Fehler der Daten im VOKALJÄGER. 
Für den VOKALJÄGER fiel die Wahl auf die von Zwicker und Terhard, Formel 
(12) von S.76, auch aufgrund der Verfügbarkeit einer einfachen Umkehrfunktion. 
In Abbildung 23 auf S. 77 ist der Einfluss der auditorischen Bark-Skalierung auf 
die Formanten F1 und F2 zu erkennen: Den streng äquidistanten und gerundeten 
Hauptskalen in Bark (links: Fl, unten: F2) sind die äquivalenten Nebenskalen in 
Hertz (rechts: Fl, oben: F2) zugeordnet, die nicht mehr äquidistant sind. Diese 
Darstellung in der F1/F2-Ebene ist die Standarddarstellung dieser Arbeit (vgl. 
Abschnitt A.3.2 ab $. 446 zu weiteren Details). Nur zur Vollständigkeit sollen die 
Mel-Transformation und die ERB- Transformation erwähnt werden (vgl. Anhang 
A.3.4, S. 448.). 

Abbildung 24 auf S. 78 zeigt verschiedene auditorische Transformationen (sowie 
die Einheitstransformation n(F)) = F als Winkelhalbierende). Die absoluten Wer- 
te der Transformationsfunktionen sind für den Vergleich unerheblich und wurden 
durch eine Normierung beseitigt. Zur Normierung wurde der für die Formanten re- 
levante Bereich von 100 bis 3.000 Hz angesetzt und n(100) = 0 sowie n(3.000) = 1 
gesetzt. In besagtem Frequenzbereich hält die Bark-Transformation etwa die Mit- 
te zwischen ERB und Mel. Die Abweichungen sind im Wesentlichen gering. Alle 
Transformationen sind konkav bezüglich der Einheitstransformation, was bedeutet, 
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Abbildung 23: Gezeichnet sind für eine hochdeutsche Sprecherin exemplarisch die 
extremen Vokale [ir/a:/u:], jeweils gegen eine lineare äquidistante Hauptskala in Bark 
(links für Fl und unten für F2) sowie eine Nebenskala in Hertz (rechts für Fl und 
oben für F2). Die Skalen sind invertiert, um eine optische Ähnlichkeit mit dem pho- 
netischen Vokalviereck zu erreichen. Proportionalen Schritten auf der F1-Skala in 
Bark (links) entsprechen wachsende Schrittweiten auf der F1-Skala in Hertz (rechts). 
Dasselbe gilt für F2 (obere Skala), nur sind hier die Schritte in Hertz noch größer, 
da F2 über F1 liegt. 
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Abbildung 24: Verschiedene Transformationsfunktionen n(F') von einer Frequenz- 
skala F' in Hz auf andere auditorische Skalen. 


das höhere Frequenzen im Vergleich zu niedrigeren gestaucht werden. Die logarith- 
mische Transformation findet häufig in grafischen Darstellungen Anwendung. Für 
den VOKALJÄGER ist die Transformation nach Bark - in der Form (12) von S. 76 
— die maßgebliche. 


3.5.3 Zur Sprechernormalisierung 


Der Einfluss des Vokaltrakts und die Eliminierung desselben, die Sprechernorma- 
lisierung bzw. Vokaltraktnormalisierung beschäftigt die phonetische Wissenschaft 
seit mehr als 40 Jahren und es existieren mittlerweile umfangreiche vergleichen- 
de Untersuchungen und Übersichtsartikel (Pols u.a. [1973], Disner [1980], Pisoni 
[1996], Adank u.a. [2004], Johnson [2005], Clopper [2009], Fabricius u.a. [2009], 
Flynn [2011] und Flynn/Foulkes [2011]). Die üblichen Standardverfahren werden 
für den VOKALJÄGER kritisch untersucht und insbesondere hinsichtlich ihrer Ro- 
bustheit weiterentwickelt. Die neuen robusten Verfahren werden in Abschnitt 3.6 
ab S. 84 vorgestellt. Im Fokus liegen ihrer Bedeutung gemäß die Formantfrequenzen 
und hier hauptsächlich die ersten drei, F1, F2 und F3. Es gibt zwei fundamental 
unterschiedliche Herangehensweisen an die Formantnormalisierung: zum einen die 
intrinsische Normalisierung, zum anderen die extrinsische Normalisierung. Sowohl 
die intrinsische als auch die extrinsische Normalisierung übertragen Werte von ei- 
ner originalen absoluten Skala, z.B. in Hertz, auf eine relative. Im Konzept sind 
beide gleich, der Unterschied liegt in dem gewählten Bezugsrahmen, der ‚relativ‘ 
definiert. 
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Die intrinsische Normalisierung basiert auf der Hypothese, dass alle relevan- 
ten phonetischen Informationen zum korrekten Verständnis des Lauts exakt zum 
Zeitpunkt, und nur genau zu diesem Zeitpunkt, vorhanden sind. Somit kann auch 
alle irrelevante Information genau zu diesem Zeitpunkt eliminiert werden (denn 
genau das macht der menschliche Hörapparat). Einer Einordnung in einen Refe- 
renzrahmen oder eines Vergleichens, etwa mit den Lauten, die vorher gesprochen 
wurden, bedarf es nicht. Alle Information ist dem Lautschallsignal genau zu ei- 
nem Zeitpunkt intrinsisch. Intrinsische Verfahren setzen verschiedene akustische 
Größen an diesem einen Zeitpunkt zueinander in Bezug, etwa durch Differenzen- 
bildung. In die Kategorie der intrinsischen Verfahren fällt z. B. der effektive zweite 
Formant aus Fant (1959), hier Abschnitt 3.5.4 ab S.80 oder die Formantdeltas aus 
Syrdal/Gopal (1986), hier Abschnitt 3.5.5 ab S. 81. 

Extrinsische Normalisierung hingegen beruht auf der Hypothese, dass ein Laut 
nur im Vergleich zu den anderen Lauten desselben Sprechers verstanden werden 
kann. Extrinsische Verfahren setzen akustische Größen, die zu verschiedenen Zeit- 
punkten gemessen werden, zueinander in Bezug, etwa durch Abstandsmessung vom 
einem über die Zeit errechneten Mittelwert. Somit muss der Laut in einen Bezugs- 
rahmen eingesetzt werden. Joos (1948, 61) spricht von einem Koordinatensystem, 
das sich dem Hörer erschließt und in dem der gehörte Laut verortet wird: 


„What seems to happen, rather, is this. On first meeting a person, the listener hears a few 
vowel phones, and on the basis of this small but apparently sufficient evidence he swiftly 
constructs a fairly complete vowel pattern to serve as a background (coordinate system) 
upon which he correctly locates new phones as fast as he hears them.“ 


In die Kategorie der extrinsischen Verfahren fällt etwa der Z-Wert aus Lobanov 
(1971), hier Abschnitt 3.5.7 ab S. 82 oder die Bereichsnormalisierung aus Gerstman 
(1968), hier Abschnitt 3.5.6 ab $. 81. 

Abhängig von dem gewählten Bezugsrahmen können sich Mischformen zwi- 
schen intrinsischen und extrinsischen Methoden ergeben. „Normalization methods 
have traditionally been categorized according to whether they are vowel intrinsic 
or extrinsic, formant intrinsic /extrinsic, speaker intrinsic/extrinsic, or a combinati- 
on“ (Flynn/Foulkes 2011, 683). Wird nur ein Zeitpunkt (ein Vokal) berücksichtigt, 
ist die Methode vokalintrinsisch, sonst vokalextrinsisch. Dies ist die allgemeine 
Definition von intrinsisch und extrinsisch. Nutzt die Methode nur einen Forman- 
ten (z.B. den ersten Formanten Fl), ist sie formantintrinsisch. Nutzt sie mehrere 
(z.B. um die Differenz vom ersten Formanten Fl zum zweiten F2 zu errechnen), 
ist sie formantextrinsisch. Beschränkt sich die Methode auf die Messwerte eines 
Sprechers, ist sie sprecherintrinsisch, sonst sprecherextrinsisch. Adank u. a. (2004, 
3105) schließen, dass die besten Normalisierungsverfahren 


„were found to preserve phonemic variation best, reduce anatomical/physiological variation 
most effectively, while at the same time preserving nearly all sociolinguistic variation in the 
acoustic measurements [... and that the] most successful procedures are all vowel-extrinsic 
procedures and the least successful procedures are all vowelintrinsic procedures.“ 
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Flynn/Foulkes (2011, 686) stellen fest: 


„The |[...] vowel-intrinsic scaling transformations all performed poorly [...|. This result support 
claims that vowel-intrinsic methods are inadequate, at least for sociophonetics. [...] The best 
methods were vowel-extrinsic, formant-intrinsic, speaker intrinsic.“ 


Calamai (2005, 249) findet Defekte bei intrinsischen Methoden: 


„It follows that intrinsic vowel normalization procedures seemed effective at maximizing dif- 
ferences between vowel categories but seemed somehow deficient in minimization differences 
in the same vowel spoken by different speakers.“ 


Der Einschätzung der Überlegenheit extrinsischer Methoden schließt sich Clopper 
(2009) an. 

Extrinsische Verfahren sind allerdings anfällig für Fehlerfortpflanzung. Sie sind 
nicht robust. Ein einziger Extremwert kann die gesamte Normalisierung durch 
einen Ketteneffekt zerstören, da ja ein extrinsisches Verfahren gerade alle (oder vie- 
le) Messwerte zueinander in Bezug setzt (inklusive des Extremwerts!). Fehlerhafte 
Messwerte können das Koordinatensystem verzerren. Bei intrinsischen Verfahren 
ist der Einfluss eines extremen Messwerts nur auf einen Zeitpunkt beschränkt und 
eine Vererbung des Fehlers ist ausgeschlossen. Ob nun aber letztendlich ein extrinsi- 
sches oder ein intrinsisches Verfahren (oder beide) für einen bestimmten Datensatz 
besser geeignet ist, kann nur durch Verprobung aller Verfahren bestimmt werden. 
Dieser Kombinationsansatz wird im VOKALJÄGER verwendet. 


3.5.4 Fants effektiver zweiter Formant 


Eine spezielle intrinsische Normalisierung (nur) des zweiten Formanten F2 wird 
von Fant (1959) mit dem Effektiven Zweiten Formanten 


Bere) 


Bed 
Pa me) 


(13) 


eingeführt. Im VOKALJÄGER ist er mit E2 bezeichnet (’E’ von ’effektiv’). Die 
Kernidee Fants ist „to take into account a gradual increase in the importance of 
the third formant as F3 is raised in frequency“ (Fant 1959, 52). E2 ist von Fant so 
aufgesetzt, dass E2 sich F2 nähert, wenn F2 nahe Fl ist und E2 sich F3 nähert, 
wenn F2 sich F3 nähert. Dies trägt der von Chistovich (1985, 802) beschriebe- 
nen Beobachtung Rechnung, dass das menschliche Gehör Formanten, die näher als 
3,5 Bark beieinander liegen, wie etwa F2 und F3 bei bestimmten Vokalen, nicht 
unterscheiden kann. Fant wendet in seinem Originalartikel die Methode nur auf 
Formantfrequenzen in Hertz und Mel an. Im VOKALJÄGER wird Fants E2 in Hertz 
errechnet und anschließend nach Bark auditorisch transformiert. Fants Methode 
fehlt in Flynn/Foulkes (2011, 686), würde aber entsprechend als vokalintrinsisch, 
sprecherintrinsisch, aber formantextrinsisch bezeichnet werden: Es findet eine For- 
manten übergreifende Verrechnung Anwendung. Das Ergebnis wird in Hertz (bzw. 
Bark) notiert. 
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3.5.5 Syrdals Formantdeltas 


Syrdal/Gopal (1986) schlagen vor, die Formanten nach Transformation auf eine 
auditorische Bark-Skala durch Differenzenbildung 


D;= FF (14) 
zu normalisieren, und merken dazu an: 


„[--.] the proposed bark difference model of vowel perception by humans offers a powerful, 
comprehensive solution to two major problems of vowel recognition: the inherent speaker- 
independent normalization of acoustic variability and a perceptually based quantitatively 
defined link between acoustic and phonetic features“ (Syrdal/Gopal 1986, 1099). 


Im Rahmen des VOKALJÄGERs werden die Differenzen als Syrdal-Deltas DO, D1 
usw. bezeichnet. Syrdals Delta-Methode stellt ein intrinsisches Verfahren dar. Das 
nullte Syrdal-Delta DO ist die Differenz zwischen dem ersten Formanten Fl und 
der Grundfrequenz FO (siehe hierzu auch Abschnitt 3.4.1, S. 72£.). Flynn/Foul- 
kes (2011, 686) benennen Syrdal-Deltas nicht explizit, aber führen ein mit Bark 
differences bezeichnetes Äquivalent auf. Dieses ist als vokalintrinsisch, formantex- 
trinsisch und sprecherintrinsisch bezeichnet. Syrdal-Deltas werden in Hertz (bzw. 
Bark) gemessen. Viele Autoren verwenden in ihren Untersuchungen und Lehrtex- 
ten Syrdal-Deltas, so etwa Hillenbrand/Gayvert (1993) und Pisoni (1996, 12). 


3.5.6 Gerstmans Bereichsnormalisierung 


Gerstman (1968, 3) schlägt eine Normalisierung 


F5 — min{F5} 
max{F}} — min! F;} 


(15) 


auf den Wertebereich der Formantfrequenzen vor. Der niedrigste Messwert für F/, 
wird nach Normalisierung den Wert O0 haben und der höchste den Wert 1. Diese 
erzwungene Einschränkung des Wertebereichs ist für viele nachgelagerte statisti- 
sche Verfahren von Vorteil. Flynn/Foulkes (2011, 686) sortieren Gerstman unter 
vokalextrinsisch, sprecherintrinsisch und formantintrinsisch. Aus der Konstruktion 
der Berechnung ergibt sich ein auf den Bereich von 0 bis 1 eingeschränkter Werte- 
bereich. Da dieser Bereich für alle mit der Gerstman-Normalisierung berechneten 
Größen gilt, ergibt sich eine Vergleichbarkeit über die Größen hinweg. Aufgrund 
seiner Konstruktionsweise ist Gerstmans G-Wert allerdings nicht robust. Darauf 
wird in Abschnitt 3.6 ab S. 84 und insbesondere Abschnitt 3.6.5 ab S. 90 eingegan- 
gen. Die Bereichsnormalisierung nach Gerstman wird häufig verwendet, so etwa 
bei Pätzold/Simpson (1997, 234) für die Vokale des Kiel-Korpus. 
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3.5.7 Lobanovs Z-Wert-Normalisierung 


Ein einfaches und in der Statistik ganz allgemein übliches Normalisierungsverfah- 
ren ist das Zentrieren auf den Schwerpunkt und Skalieren um die Streubreite (in 
der englischsprachigen Literatur Z-transformation). Genau dieses Verfahren führt 
Lobanov (1971) mit 


F: — uf F. 
o{F;} 
für die Formanten in die Phonetik ein. Dabei ist 
1 T 
ul} = I elk] a7) 
k=1 


der jeweilige Mittelwert über alle Messwerte des ersten, zweiten usw. Formanten 
eines Sprechers**. 


oa} = (all tar)? (18) 


ist die Standardabweichung. Flynn/Foulkes (2011, 686) klassifizieren den Lobanov- 
Z-Wert vokalextrinsisch aber sprecherintrinsisch und formantintrinsisch: Zwar wer- 
den alle Formanten eines Sprechers berücksichtigt, aber es findet kein Verrechnen 
der Formanten untereinander statt. Ebenso bleiben die Sprecher streng getrennt. 
Der Lobanov-Z-Wert ist so konstruiert, dass er den Mittelwert 0 und die Stan- 
dardabweichung 1 hat. Damit haben alle so normalisierten Messgrößen dieselben 
standardisierten Verteilungsmomente und sind vergleichbar. Das Ergebnis — also 
der Z-Wert — soll hier in Z bezeichnet und gemessen werden. Im Originalarti- 
kel wird das Verfahren auf lineare Formanten in Hertz angewendet, doch eignet 
es sich genauso für Formanten auf einer auditorischen Skala, wie etwa in Bark. 
Verwandt ist das Verfahren nach Nearey, was hier nur erwähnt werden soll (vgl. 
Anhang A.3.5, S.448f.). Aufgrund seiner Konstruktionsweise ist dieser Z-Wert 
allerdings nicht robust. Darauf wird in Abschnitt 3.6 ab S.84 und insbesondere 
den Abschnitten 3.6.6 ab S.91 und 3.6.7 ab S.91 eingegangen. In der komparati- 
ven Studie von Adank u.a. (2004, 3102) erreicht der Lobanov-Z-Wert den ersten 
Platz. Das Z-Wert-Normalisierungsverfahren stellt den De-facto-Standard dar und 
wird in vielen neueren Studien verwendet, so z.B. in Nance (2013, 140). 


3.5.8 Weitere Anmerkungen zur Normalisierung 


1. Für die DCT-Parameter aus Abschnitt 3.3.3 ab $. 56 ist die Frage einer pho- 
netisch sinnvollen Normalisierung komplex. Da der erste DOT-Parameter der 
Mittelwert über die Formantbahn ist, gilt alles, was über Formantnormalisie- 
rung gesagt wurde, entsprechend. Für DUT-Parameter höherer Ordnung sind 


44er Index k läuft hier über alle K Vokalproben bzw. Lautsegmente der Sprachprobe. Die 
Formel für den Mittelwert ist aber allgemein gültig, insbesondere auch wenn anstatt des Proben- 
index k der Zeitindex t steht. 
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etwa die Bereichsnormalisierung nach Gerstman (vgl. Abschnitt 3.5.6, S. 81£.) 
und der Lobanov-Z-Wert (vgl. Abschnitt 3.5.7, S.82f.) rein mathematisch gül- 
tig - und werden auch im VOKALJÄGER so angesetzt. Jedoch ergibt sich keine 
einfache inhaltliche Bedeutung wie bei den Formanten (wo z.B. eine Gerstman- 
Normalisierung gleichbedeutend mit einer Einschränkung auf die Extremstel- 
lungen des Artikulationsapparats ist). So ist der dritte DCT-Parameter ein 
Maß für die maximale Auslenkung der Formantbahn aus ihrem Mittel. Aber 
das gilt auch nur in erster Näherung, da der Bogen, der durch den dritten DCT- 
Parameter bestimmt ist, mit dem Halbbogen aus dem zweiten DCT-Parameter 
überlagert. Eine Normalisierung dieser Parameter, um dediziert eine phoneti- 
sche Sprecherunabhängigkeit zu erzielen, ist komplex. 


2. Das Gleiche gilt für Parameter, die aus den in Abschnitt 3.4.4, $. 73f., erwähn- 
ten Vollspektrum-Ansätzen entwickelt wurden. Hier kann Sprecherunabhän- 
gigkeit durch entsprechende komplexe Methoden erreicht werden. Zahorian/ 
Jagharghi (1991, 68) etwa transformieren den Frequenzbereich, um Sprecherab- 
hängigkeiten zu eliminieren (sogenannte Frequenzfaltung, frequency warping). 


3. Die in Abschnitt 3.5 beschriebenen Verfahren transformieren Messwerte von 
einer originalen Skala auf eine Zielskala. Im Ergebnis ändert die Transformati- 
on die Verteilung der Messwerte, wenn man von der einen Skala auf die andere 
übergeht. So ist die Verteilung nach der Transformation nach Gerstman werte- 
bereichsbeschränkt und nach der Transformation von Lobanov mittelwertsfrei. 
Ähnlich ist die Situation für die auditorischen Transformationen (vgl. Abschnitt 
3.5.2, $.75f.). Man kann aber nun noch einen Schritt weiter gehen und nach 
einer beliebigen Transformation fragen, die eine originale Verteilung auf eine 
beliebige Verteilung mit bestimmten Eigenschaften überführt. Dies ist ein ganz 
allgemeines statistisches Verfahren. Üblich ist z.B. der Versuch Verzerrungen 
aus der Verteilung zu eliminieren (Kuhn/Johnson 2013, 31). 


Der VOKALJÄGER hat zurzeit keine der hier angedeuteten Spezialverfahren im- 
plementiert. 
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3.6 Robuste Formantberechnung 


3.6.1 Systematische und erratische Robustheit 


Wann ist ein Algorithmus robust? „Robustness signifies insensitivity to small de- 
viations from the assumptions“ (Huber 1981, 1). Für Hampel/Ronchetti (2009, 7) 
bezieht sich robuste Statistik auf „deviations from idealized assumptions in sta- 
tistics“. Ein robuster Algorithmus liefert auch dann aussagekräftige Ergebnisse, 
wenn er mit unerwarteten Messergebnissen konfrontiert wird. Ein klassischer Fall 
sind die sogenannten Ausreißer, oft Messergebnisse mit unerwartet großen Werten, 
die klassische Verfahren vor Probleme stellen: 


„Outliers are sample values that cause surprise in relation to the majority of the sample. 
This is not a pejorative term; outliers may be correct, but they should always be checked 
for transcription errors. They can play havoc with standard statistical methods“ (Venables/ 
Ripley 2002, S. 119). 


Ausreißer sind „data that doesn’t fit the pattern set by the majority of the data“ 
(Hampel 2001, 2). Als Beispiel denke man an eine gemessene erste Formantfre- 
quenz von 100.000 Hertz. Dieser Wert für F1 ist klar unerwartet und vermutlich 
fehlerhaft, da die erste Formantfrequenz üblicherweise im Bereich von etwa 200 bis 
1.100 Hertz liegt. Würde man diesen Ausreißer in einen klassischen arithmetischen 
Mittelwert einbeziehen, würde er diesen völlig verzerren. Der klassische Mittelwert 
ist also nicht robust. 

Für den VOKALJÄGER ist eine statistische Methode systematisch robust, wenn 
sie gegenüber einer kleinen systematischen Änderung vergleichbare Ergebnisse lie- 
fert. Die Normalisierung des VOKALJÄGERs muss systematisch robust sein. So 
mag der eine Dialekt (oder die eine Sprache oder Messung) systematisch einen 
bestimmten Vokal aufweisen, der andere Dialekt (oder die andere Sprache oder 
Messung) diesen systematisch nicht. Dieses systematische Fehlen oder Vorhanden- 
sein wird sich auf die Parameter der Verteilung auswirken (etwa den Mittelwert 
oder den Wertebereich der Formanten). Für den VOKALJÄGER ist eine Metho- 
de erratisch robust, wenn sie bei erratisch auftretenden Messfehlern vergleichbare 
Ergebnisse liefert. Insbesondere ist sie erratisch robust, wenn sie mit fehlerhaften 
Extremwerten, den Ausreißern, umgehen kann. 

Viele der für den VOKALJÄGER gesichteten messphonetischen Texte überge- 
hen die Problematik der robusten Berechnung oder detaillieren nicht weiter. Dies 
betrifft sowohl die Frage der systematischen als auch der erratischen Robustheit. 
Möglicherweise war es den Autoren möglich, durch händische Arbeit extreme Mess- 
werte zu eliminieren oder durch Neumessung zu korrigieren. Doch ist ein solches 
Vorgehen zu zeitaufwendig für ein Prozessieren größerer Korpora, wie es mit dem 
VOKALJÄGER angestrebt wird. Daher muss eine weitgehend automatisierbare Me- 
thode gefunden werden. 
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Grundsätzlich gibt es zwei verschiedene Ansätze, mit extremen und vermut- 
lich fehlerhaften Messwerten umzugehen und so Robustheit zu erzielen. Der erste 
und einfachere Ansatz ist die Bereinigung bzw. die Suche nach „rules for rejection 
of outliers* (Hampel 2001, 2), für die eine umfangreiche Literatur existiert (vgl. 
z.B. Barnett/Lewis 1994). Man sucht hier ein Verfahren, extreme Messwerte zu 
identifizieren und dann bei Folgeberechnungen wie der Normalisierung gezielt aus- 
zuschließen. Allerdings bezieht sich der Ausschluss hier nur auf die Parameter der 
Berechnung, nicht auf die Berechnung selbst. Man würde also z.B. bei angestrebter 
Verwendung eines Lobanov-Z-Werts, Formel (16) von $.82, nur für die Berechnung 
der Parameter Mittelwert u, Formel (17) von $.82, und Standardabweichung o, 
Formel (18) von S.82, die Extremwerte ausschließen (oder gesondert behandeln). 
Die eigentliche Berechnung des Z-Werts kann dann auch für die Extremwerte er- 
folgen, sie ist nun robust. 

Der zweite und überlegenere Ansatz ist der der inhärenten Robustheit. Hier 
sucht man ein Verfahren, das keiner vorangehenden Bereinigung bedarf, da die 
Methode in sich robust gegen extreme Messwerte ist. 


„Robust statistics is the stability theory of statistical procedures. It systematically inves- 
tigates the effects of deviations from modelling assumptions on known procedures and, if 
necessary, develops new, better procedures“ (Hampel 2001, 1). 


Ein einfaches Beispiel ist die Verwendung des Medians, also des 50%-Perzentils, 
anstatt des Mittelwertes. Eine Besonderheit einer inhärent robusten Methode ist 
aber, dass sie eine eigene, in sich neue Methode darstellt, die sich in ihren statis- 
tischen Eigenschaften von denen der originalen (nicht robusten) Methode unter- 
scheidet. Zur robusten Statistik und der Theorie der robusten Methodik existiert 
eine umfangreiche Literatur. Die für den VOKALJÄGER relevanten Methoden wer- 
den in den folgenden Abschnitten beschrieben, sonst sei hier auf die Standardwerke 
Huber (1981) und Hampel/Ronchetti (2009) verwiesen. Eine Übersicht findet sich 
in Hampel (2001) und Venables/Ripley (2002, 119-126). 

Die folgenden Abschnitte beschreiben die robusten Algorithmen des VOKAL- 
JÄGERS. Sie sind Erweiterungen bzw. ergänzende Umformulierungen der Mecha- 
nismen aus Abschnitt 3.5, S. 74f. 


Inhärente Robustheit wird im VOKALJÄGER durch Kombination zwei- 
er Verfahren erreicht: zum einen durch robuste Sprechernormalisierung 
(Abschnitt 3.6 bis 3.6.7 ab S. 84), zum anderen durch die Methode der 
Rückfaltung zur Erkennung und Korrektur von Ausreißern (vgl. Ab- 
schnitt 3.6.9 auf $.93). 


Das Hauptaugenmerk liegt auf der robusten Formantberechnung und robusten 
Sprechernormalisierung von Formanten, doch können die Verfahren ganz allgemein 
auf akustische Messwerte angewendet werden. 
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3.6.2 Ordnungsstatistik und Perzentilmittel 


Ordnungsstatistiken (order statistics) haben sich als sehr nützlich für das Schaf- 
fen robuster Verfahren erwiesen und werden im VOKALJÄGER eingesetzt. In die- 
sem Abschnitt werden die für den VOKALJÄGER notwendigen mathematischen 
Konzepte kurz eingeführt (David 1980). Für eine beliebige Folge von K Werten 
x|k] = x, (z.B. Fl, ermittelt in bzw. aus Lautsegment k) ist die Ordnungsstatistik 


I) 


so definiert, dass 
Tu) SIR) S..-R) 

gilt. Die Ordnungsstatistik z(.) ist die Sortierung der K Werte der Größe x, nach. 
Dabei ist (x) der Index nach Sortierung und k der originale Index vor bzw. oh- 
ne Sortierung. Durch die Umsortierung bzw. Umindexierung von k auf (x) wird 
jede Information über die originale Sortierung, z.B. über die zeitliche Abfolge, 
zerstört. Es wird nun, ohne Einschränkung der Allgemeinheit, auf eine normierte 
vereinfachte Schreibweise übergegangen, die dem niedrigsten Wert den Index 0 und 
dem höchsten den Index 1 zuweist, also 


Lo, Sir Sin) Sri: 


Die niedrigste Ordnungsstatistik 
&(o) = min{x} 

ist das Minimum aller Werte von x und die höchste Ordnungsstatistik 
x) = max{x} 


ist das Maximum aller Werte. Der Median ist definiert als der mittlere Punkt der 
Ordnungsstatistik &,.), also 

m{xc} = xo5)- (19) 
Die Hälfte aller Werte von x ist kleiner als der Median von x. Der Median ist das 
50%-Perzentil P50. Das a-Perzentil ist definiert als 


Qir;a} = X). (20) 


Für z.B. a = 0,05 sind 5% aller Werte von x kleiner als das 5%-Perzentil Q{.x; 0,05}. 
Ein Perzentil kann nur für eine skalare Größe sinnvoll berechnet werden. Gegebe- 
nenfalls müssen mehrdimensionale Größen, wie zum Beispiel Formantvektoren, 
skalarisiert werden, etwa durch Anwenden einer Abstandsnorm. 

Der VOKALJÄGER nutzt eine robuste Größe, die unteres Perzentilmittel 


Q.fz;a,e} = u (2a; ne a) (21) 
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Abbildung 25: Häufigkeitsverteilung über F2 für zwei Sprachproben zwei unter- 
schiedlicher Sprecher (links hochdeutsch aus dem Kiel-Korpus; rechts Frankfurter 
Lautdenkmal). Die Proben sind systematisch unterschiedlich hinsichtlich der Laut- 
häufigkeiten (in der rechten fehlen z.B. die Reduktionsvokale). Gezeichnet ist das 1% 
bis 5% und 95% bis 99%-Perzentilband (grau unterlegt) sowie das in den Bändern 
errechnete untere und obere Perzentilmittel (durchgezogene Linie, jeweils links und 
rechts außen). Die Perzentilmitte (gestrichelt) ist der Mittelpunkt zwischen unterem 
und oberem Perzentilmitteln, die Perzentilbreite ist der Abstand. 


und oberes Perzentilmittel 
Qf2;w,e} = u (2u-0: en z-040)) (22) 


genannt werden soll. Dabei ist u(.) die Mittelwertfunktion, Formel (17) von S. 82, 
die nur die angegebenen Werte der Ordnungsstatistik x.) einbezieht. Es wird also 
für das untere Perzentilmittel der Mittelwert nur jener Werte von x berechnet, 
die sich in dem a — e bis a Perzentilband der Breite e befinden. Für das obere 
Perzentilmittel gilt entsprechend das 1— a bis 1— «+ e Perzentilband. Die Per- 
zentilparameter & und e sind experimentell bestimmte Erfahrungswerte. Für den 
VOKALJÄGER werden a = 0,05 und e = 0,04 angesetzt. Dies bedeutet, dass das 
untere Perzentilmittel der mittlere Wert der niedrigsten 1% bis 5% der Messwerte 
ist. Entsprechend ergibt sich das obere Perzentilmittel als Mittelwert der größ- 
ten 95% bis 99% Messwerte®’. Die Perzentilmittel sind in Abbildung 25 auf $.87 
veranschaulicht. 

Das für den VOKALJÄGER definierte Perzentilmittel ist eine asymmetrische 
Variante des alpha trimmed mean filter (Peterson u.a. [1988] und Pitas/Venetsa- 
nopoulos [1992, 1904]) 


HK (2), 3 21-0) > 


45Dje Perzentilränder werden insbesondere bei kleinen Populationen interpoliert. Falls die Po- 
pulation überaus klein ist, kann es auch vorkommen, dass das Perzentilband leer ist. In diesem 
Fall wird die Mitte des Perzentilbands interpoliert. Der angesetzte Interpolationsalgorithmus ist 
‚type 7‘, was dem Standard in R entspricht (vgl. auch Hyndman/Fan 1996). 
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Dieser errechnet einen Mittelwert über x, ohne dabei die kleinsten « Werte und 
größten & Werte zu berücksichtigen. Damit bleiben automatisch Extremwerte und 
Ausreißer außen vor. Alpha-trimmed-Mean-Filters haben sich als robuste Algo- 
rithmen seit den 1980er-Jahren, insbesondere in der digitalen Bildverarbeitung, 
bewährt (Pitas/Venetsanopoulos 1992, 1915). Das untere und das obere Perzen- 
tilmittel geht als Parameter in nachgelagerte Berechnungen ein. Empirische Un- 
tersuchungen zur Robustheit dieser Maße finden sich dann in Abschnitt 4.2.5 ab 
5.121. 


3.6.3 Interpretation des Perzentilmittels für Formanten 


Das Perzentilmittel kann auf jede Messgröße angewendet werden. Für Formanten 
jedoch hat es besondere Bedeutung. In Abschnitt 3.2.3, S. 47£., wurde gezeigt, dass 
die Formanten ein charakteristisches Muster aufweisen. Für einen Sprecher bzw. 
eine Sprecherin liegen die Formanten in einem bestimmten Wertebereich. Das ist 
gut aus den Formantdiagrammen der Kardinalvokale von Seite 49 zu erkennen: 
Abbildung 11 zeigt, dass — für Daniel Jones in dieser Aufnahme - F1 zwischen 
etwa 200 Hz und 900 Hz liegt sowie F2 zwischen 700 Hz und 2.500Hz. Abbildung 
12 zeigt F3 in dem Bereich von etwa 2.000 Hz bis 4.000 Hz. 

Was bedeutet das? Unabhängig von der Vielheit der Vokale, die in einer Auf- 
nahme gefunden werden, und unabhängig vom Reichtum des Vokalinventars, wer- 
den die Formanten bestimmte Ober- und Untergrenzen in einer Messung nicht 
durchbrechen. Denn diese Grenzen sind durch den Artikulationsapparat gegeben. 
Es war Daniel Jones nicht möglich, den Mund weiter zu öffnen als beim [a], also 
wird, gleich welchen Laut Daniel Jones spricht, F1 nicht wesentlich über 900 Hz 
steigen. Das Gleiche gilt für die maximale Schließung in [il] und [u]. Alle ande- 
ren Laute werden in F1 niemals wesentlich unter 200 Hz fallen, denn Daniel Jones 
konnte den Zwischenraum zwischen Zunge und Gaumen nicht über das Extremmaß 
bei [i] und [u] verkleinern. Für F2 und F3 lassen sich entsprechende Überlegungen 
anstellen. 

Es gibt also bestimmte Grenzwerte bzw. Bänder für F1, F2 und F3 (ebenso für 
F4). Das Perzentilmittel sucht nun diese Grenzwerte zu finden. Die in den folgenden 
Abschnitten vorgestellten Verfahren setzen die Formanten zu diesen Grenzwerten 
in Bezug. Sie normieren die Formanten auf diese Grenzwerte. Das hat einen un- 
mittelbaren Vorteil: Die Grenzwerte sind wahrlich sprecherabhängig, da sie nur 
durch den Artikulationsapparat des Sprechers bedingt sind. Sie hängen nicht vom 
Vokabular oder der Verteilung der Vokale in einer Sprachaufnahme ab (das gilt na- 
türlich nur, wenn die Verteilung eine belastbare Schätzung der Grenzwerte erlaubt, 
was nicht immer der Fall ist. Siehe dazu Anmerkungen zur Tetragonnormalisierung 
in Abschnitt 3.6.9 ab $. 93). Die Verteilung der Vokale und damit der in einer Mes- 
sung aufgefunden Formantwerte können gestört sein. Solche Störungen treten aber 
gerade für die ersten beiden Formanten F1 und F2 sehr leicht auf. Ein Beispiel ist 
das Vorhandensein unbetonter (zentraler) Vokale in der einen, aber nicht in der 
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anderen Messung (oder Transkription). Verfahren, die auf zentralen Momenten 
der Verteilung aufsetzen, wie der originale Lobanov-Z-Wert, zeigen sich geeignet 
für Messungen, die über Sprecher hinweg auf normierten Korpora erstellt wurden, 
wie etwa den Wenkersätzen. Sie zeigen jedoch Probleme bei variierenden Grundge- 
samtheiten, wie sie etwa in der spontanen Rede des Lautdenkmals auftreten (vgl. 
Abschnitt 8.2.1 auf $.276). Adank u.a. (2004) führten bezeichnenderweise ihre 
komparative Studie mit einem standardisierten Korpus über verschiedene Spre- 
cher durch - der beschriebene negative Effekt trat also hier nicht auf. Die im 
VOKALJÄGER genutzten Perzentilmittel kennen diese Problematik nicht, da das 
komplette Zentrum der Verteilung zur Kalibrierung ignoriert wird (genauer: alle 
Werte zwischen dem unteren und oberen Perzentilmittel, also in der für den VOo- 
KALJÄGER angesetzten Kalibrierung etwas mehr als 90%). Ebenso ignoriert der 
Ansatz die Werte, die jenseits der Perzentilränder liegen. Perzentilnormierte Ver- 
fahren suchen die Verteilung rein aus einem Band von außenliegenden, aber nicht 
extremen Messwerten zu bestimmen. Das Perzentilmittel erlaubt eine Normierung 
auf die artikulatorische Konstellation des Sprechers, unabhängig vom Vokabular. 

Das Perzentilmittel ist konstruiert, extrem robust gegenüber Schwankungen der 
Werte im Inneren der Verteilung zu sein. Dies ist, wie beschrieben, nötig, um mit 
unterschiedlichen Korpora umgehen zu können. Das Perzentilmittel ist allerdings 
tendenziell weniger robust gegenüber Ausreißern, da ja nur ein schmales Band an 
extremen Werten ignoriert wird (die jeweils 1% größten und kleinsten Messwerte 
im VOKALJÄGER). Deswegen muss das Perzentilmittel zwingend um eine Methode 
ergänzt werden, Ausreißer in einem vorgelagerten Schritt auf ein niedrigeres Maß 
zu reduzieren. Dazu wendet der VOKALJÄGER die Methode der Rückfaltung an, 
die in Abschnitt 3.6.9 ab S.93 beschrieben wird. 


3.6.4 Perzentilbreite und Perzentilmitte 


Es bietet sich an, aus dem oberen Perzentilmittel Q, gemäß Formel (22) von S.87 
und dem unteren Perzentilmittel Q, gemäß Formel (21) von S.86 zwei einfache 
abgeleitete Größen zu definieren. Zum einen sei die Perzentilbreite definiert als 


QriF;} = Or} — Oullst (23) 
Dies ist der Abstand zwischen dem oberen Perzentilmittel Q, und dem unteren 
Perzentilmittel Q, (Man betrachte auch die exemplarische Darstellung in Abbil- 
dung 25 auf $. 87). Die Perzentilbreite ist ein Maß für die Streubreite der Werte und 
korrespondiert mit der klassischen Standardabweichung o. Es ist möglich, beide 


Werte mit einem Faktor k auf eine gemeinsame Skala zu überführen, etwa um eine 
Vergleichbarkeit zu gewährleisten. Damit ergibt sich die normierte Perzentilbreite 


QptEı 
Qt (24) 
Wenn man annimmt, dass die Verteilung der Werte normal ist, kann der Faktor 


k=Z(QAF5r) - Z(QAtF5}) 
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errechnet werden. Dabei ist 
Z&) =Q(F()) 

und Q() hier die Perzentilfunktion der Standardnormalverteilung. F() ist die empi- 
rische kumulierte Verteilungsfunktion über x. F() überführt das untere (oder obere) 
Perzentilmittel von der physikalischen Skala (etwa in Bark) in seinen Perzentilwert, 
der in dem Bereich [a-; a] bzw. [1-a;1-a-+e] liegt. Q() transferiert diesen Per- 
zentilwert in den Z-Wert der Standardnormalverteilung. Entspricht z.B. das obere 
Perzentilmittel dem 97,5%-Perzentil (was das Ergebnis der F()-Funktion wäre), so 
ergibt sich ein Q(0,975) = 1,96. Wäre nun das untere Perzentilmittel 2,5%, ergibt 
sich Q(0,025) = —1,96. Der Korrekturfaktor wäre dann k = 1,96 — (-1,96) = 3,92. 
Der hier verwendete Ansatz in Formel (23) mit Perzentildifferenzen Q, — Qu geht 
für die Perzentilmittelparameter @« = 0,25, e = O0 und k = 1 in das bekannte 
Maß des Interquartilbereichs über (interquartile range IQR: Barnett/Lewis 1994, 
121). IQR-Filter sind aus der Bildverarbeitung erprobte robuste Filter (Scollar 


u.a. 1984). 
Des Weiteren sei die Perzentilmitte definiert als 
SR BR fr Gi; 5 
aut (25) 


Das ist der Mittelwert aus dem oberem Perzentilmittel Q, und dem unterem Per- 
zentilmittel Q.. Man beachte, dass dieser Wert nicht notwendigerweise dem Median 
entspricht. Filter, die auf dem Mittelpunkt nach Formel (25) basieren (mid point 
filters), stellen in der digitalen Bildverarbeitung erprobte, robuste Verfahren dar 
(Pitas/Venetsanopoulos 1992, 1905 und 1915). 


3.6.5 Robuste Gerstman-Bereichsnormalisierung 


Das originale Verfahren von Gerstman aus Abschnitt 3.5.6, S. 81f., ist sehr anfäl- 
lig für extreme Messwerte: Definitionsgemäß nutzt Gerstman den minimalen und 
den maximalen Wert der Verteilung zur Normalisierung. Aber genau diese Werte 
können Ausreißer sein. In seiner originalen Form 


F; — min{F;} 
max{P}} — min{F)} 


aus Abschnitt 3.5.6 hat sich Gerstmans Formel für den VOKALJÄGER als un- 
brauchbar erwiesen. Nur ein einziger fehlerhafter maximaler Wert zerstört au- 
tomatisch die gesamte Statistik. Der VOKALJÄGER nutzt deshalb eine robuste 
Alternative. Die im VOKALJÄGER eingeführte Form der robusten perzentilnorma- 
lisierten Gerstman-Bereichsberechung ersetzt Maximum und Minimum, also die 0 
und 1 Extremperzentile, durch oberes Perzentilmittel @, und unteres Perzentil- 
mittel Q,. Gerstmans Formel erscheint nun als 


a.- Br Wh} _ But 
Qt QUth} ME 


(26) 
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Diese Form ist robust. Der Wertebereich der originalen Gerstman-Normalisierung 
ist auf O bis 1 beschränkt. Die robuste Form hat theoretisch einen unendlichen 
Wertebereich, doch liegen die meisten der Werte zwischen 0 und 1*°. 


3.6.6 Robuste MAD-Z-Wert-Normalisierung 


Manche der im vorangehenden Abschnitt 3.5, S. 74f., beschriebenen extrinsischen 
Verfahren basieren auf den Momenten der Verteilung der Messwerte. So findet das 
erste Moment, der Mittelwert u, und das zweite Moment, die Standardabweichung 
o Eingang in Lobanovs Z-Wert 


F}- u{F;} 
or} 


Das Gleiche gilt für Neareys Formel aus Abschnitt A.3.5, S. 448 £. Insbesondere das 
zweite Moment, welches auf quadrierten Abständen basiert, ist nicht robust gegen 
extreme Messwerte. Eine inhärent erratisch robuste(re) Variante der Momente ver- 
wendet anstelle des Mittelwertes den Median aus Formel (19) von S.86, der dem 
50%-Perzentil P50 entspricht. Für die Standardabweichung o wird der MAD 


1,4826 - m{|F; — m{F;}|}, (27) 


der Median der absoluten Abweichungen vom Median gesetzt (MAD: median. ab- 
solute deviation). Der Skalierungsfaktor 1,4826 erlaubt direkten Vergleich zwischen 
MAD und klassischer Standardabweichung (Barnett/Lewis [1994, 121] und Vena- 
bles/Ripley [2002, 122]). Die Robustheit ergibt sich aus der Verwendung linearer 
anstelle quadratischer Maße. 

Für den VOKALJÄGER gilt dieselbe Formel des Lobanov-Z-Werts (siehe oben), 
jedoch mit dem Median anstatt des Mittelwertes u und dem MAD als robustem 
Ersatz für die Standardabweichung o. Damit ergibt sich die Darstellung 


Z.- F;-m{F,} 
’ 7 7,4826 .m{|F, — m{R,}]} 


(28) 


des MAD-Z- Werts. Insbesondere der robuste MAD-Z-Wert wird im VOKALJÄGER 
auf ganz allgemeine akustische Messwerte angewendet, denn er hat keinen Bezug 
auf einen phonetisch-artikulatorischen Wertebereich. 


3.6.7 Robuste Lobanov-Z-Wert-Normalisierung 


Neben dem im vorangehenden Abschnitt 3.6.6, S.91f., beschriebenen robusten 
MAD-Z-Wert nutzt der VOKALJÄGER noch eine weitere robuste Z-Wert-Variante, 
die hier perzentilnormierter Lobanov-Z- Wert genannt wird. Dieser robuste Z-Wert 


46Fxakt sind es 1— 2a der Werte. 
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ersetzt den arithmetischen Mittelwert u und die Standardabweichung o in der 
Lobanov Formel 


F- HE} 
o{F;} 
aus Abschnitt 3.5.7, S.82f., durch ihre robusten Alternativen, die Perzentilmitte 


Qm und (auf Normalverteilung skalierte) Perzentilbreite Q, aus Abschnitt 3.6.4, 
5.89. So ergibt sich die Darstellung 


2.-:. 9 Wuth} _ Bo Qui 
, QziF;} On tF5} 


(29) 


für den neuen perzentilnormalisierten Lobanov-Z-Wert. Der vorgestellte perzen- 
tilnormierte Z-Wert ist eine ganz allgemeine statistische Funktion. Entsprechend 
schränkt sich seine Anwendung auch nicht auf Formanten ein. 


3.6.8 Die Rückprojektion 


Die in den vorherigen Abschnitten beschriebenen Größen können auch umgekehrt 
werden. So lässt sich ein nicht bereichsnormierter Wert auf einer originalen Skala 
wie Bark 


aus dem bereichsnormierten Gerstman-Wert G aus Formel (26) von S.90 errech- 
nen. Analoges gilt für den perzentilnormalisierten Lobanov-Z-Wert Z aus Formel 
(29) von S. 92. Hier ergibt sich 


Z:QB 


F= 
k 


+ Qm- (31) 


Dasselbe gilt für den MAD-Z-Wert aus Formel (27) von S.91 entsprechend. Diese 
Werte haben nun eine besondere Bedeutung, wenn man für die unteren und obe- 
ren Perzentilmittel Q. und @, (bzw. für die daraus abgeleitete Perzentilmitte Qu 
und -breite @g) über eine Sprechergruppe gemittelte Werte einsetzt. Damit wer- 
den die Werte wie G und Z von einer künstlichen abstrakten Skala wieder in ihre 
originale Skala rückprojiziert. Da über eine Sprechergruppe normierte bzw. gemit- 
telte Perzentilmaße angesetzt werden, erscheinen mit unterschiedlichen Verfahren 
normalisierte Größen wieder in einer vergleichbaren und zugänglichen Skala. Die- 
se Rückprojektion basiert auf über Normsprechern errechneten Mittelwerten (vgl. 
dazu dann die Werte in Tabelle 11 auf S.128) und wird in grafischen Darstellun- 
gen verwendet. Im VOKALJÄGER wird eine gemischtgeschlechtliche Normgruppe 
angesetzt. Daher sind rückprojizierte Werte (z.B. in Bark oder Hertz) die Werte 
eines hypothetischen androgynen Sprechers des Hochdeutschen. 
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Abbildung 26: Einhüllende Formanttetragone, dargestellt für einen männlichen 
Sprecher (links: K07MR) und einen weiblichen Sprecher (rechts: KO8MR). Im Hin- 
tergrund ist das Normtetragon über alle Sprecher gezeichnet (gestrichelt). Skala in 
originalen Hertz vor Normalisierung. Diese Darstellung zeigt den wesentlich geringe- 
ren Formantbereich des männlichen Sprechers. 


3.6.9 Normtetragon, Extremdreieck und Rückfaltung 


In Abschnitt 3.6.3, S.88f., wurde schon darauf hingewiesen, dass die Formanten 
einzeln für sich betrachtet in ihren Werten eingeschränkt sind. Aber schon ein kur- 
zer Blick auf ein beliebiges Formantdiagramm wie die Kardinalvokale von Daniel 
Jones in Abbildung 11, S. 49 (oder Abbildung 26, S.93) zeigt, dass der Wertebe- 
reich des einen Formanten (etwa F1) zusätzlich vom Wert des anderen Formanten 
(etwa F2) abhängt. So liegen für Daniel Jones die F2-Werte durchaus im Allge- 
meinen zwischen 700 Hz und 2.500 Hz. Und exakt trifft das auch für geschlossene 
Vokale wie [i] und [u] zu. Dort hat F1-Werte um 250 Hz. Aber für offene Vokale, 
wie etwa [e] und [5] ist der Bereich schon deutlich auf 800 Hz bis 2.000 Hz einge- 
schränkt. Hier liegt Fl um 600Hz: Der Wertebereich von F2 hängt von Fl ab. 
Dieser Querzusammenhang zwischen F1 und F2 bzw. die sich daraus ergebende 
Beschränkung ist der mathematische Grund für das Entstehen einer Tetragonform 
in der F1/F2-Ebene?”. Diese geometrische Form soll hier als Formanttetragon be- 
zeichnet werden. Der tieferliegende Grund für diesen Zusammenhang ist natürlich 
der Artikulationsapparat, der nur bestimmte Kombinationen aus F1 und F2 ana- 
tomisch bzw. physikalisch zulässt (vgl. Abschnitt 3.2.3, S. 47): 


Es wiederholt sich die Frage aus Abschnitt 2.3.2, S.31f., ob denn eine Tetragonform über- 
haupt angemessen ist für das Hochdeutsche, das ja eine phonemische Dreiecksstruktur hat. An 
dieser Stelle sei nur das a.a.O. gemachte Argument verwiesen, dass durchaus eine statistische 
Tetragonstruktur vorhanden ist. Zur weiteren Diskussion sei vorerst auf den Ergebnisteil in Ab- 
schnitt 4.6.3 ab S. 157 verwiesen. 
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„Only a subset of all logically possible combinations of those formant frequencies is asso- 
ciated with human vowels. Thus a formant pattern F} = 100Hz, Fa = 200Hz, and F3 = 
300 Hz would be a reasonable description of a machine-made ’vowel sound’, but an absurd 
statement about a natural vowel. [...] The vowels that can be produced |[...] are located in a 
three dimensional acoustic space whose dimensions are the first three formant frequencies“ 
(Liljencrants/Lindblom 1972, 840). 


Nach Broad/Wakita (1977) liegen F1 bis F3 auf einer „piecewise-planar surface“ 
mit definierten Rändern. 

Wenn man diese Ränder nun mathematisch beschreiben und technisch errech- 
nen kann, ergeben sich für die robuste Formantberechnung und -normalisierung 
neue Möglichkeiten. Für den VOKALJÄGER ist ein Algorithmus entwickelt worden, 
der die Ränder des Formanttetragons in der F1/F2-Ebene für einen Sprecher - oder 
eine Sprechergruppe - vollautomatisch errechnen kann. Dazu wird angesetzt, dass 
sich das Formanttetragon der Laute aus einem Formantdreieck ergibt, dessen Spitze 
gekappt wird (vgl. Abschnitt 3.6.10, S. 98£f., zu den Details der Methode). In Ab- 
bildung 26 auf S. 93 sind exemplarisch Ergebnisse für einzelne Sprecher aufgezeigt. 
Man kann nun das Formanttetragon und das zugrundeliegende Formantdreieck für 
eine Normgruppe von Sprachproben errechnen, um Informationen über die allge- 
mein zu erwartende Verteilung der Formanten in der F1/F2-Ebene zu erhalten. Im 
VOKALJÄGER werden drei geometrische Formen unter Nutzung des Konzepts der 
Ordnungsstatistik und der Perzentilmittel errechnet (vgl. Abschnitt 3.6.2, S. 86£.). 
Zum einen ist es das sogenannte Normtetragon, das auf einem geschlechtsüber- 
greifenden Formantdreieck beruht, dessen Kanten auf dem oberen Perzentilmittel 
basieren (Mittelwert im 95% bis 99%-Band) — dies dient der Veranschaulichung 
in Grafiken. Zum anderen werden zwei Formantdreiecke, eines pro Geschlecht, die 
sogenannten Extremdreiecke, bestimmt. Aus der Sicht einer Kante des Extrem- 
dreiecks liegen jeweils 99% der Messwerte diesseits der Kante, also tendenziell im 
Inneren des Extremdreiecks**®. 


3.6.9.1 Die Rückfaltung 


Was bedeutet nun das Extremdreieck bzw. Normtetragon für die Formantfläche? 
In Kapitel 3.6.3, S. 88f., wurde erläutert, welche Bedeutung die (eindimensionalen) 
Perzentilmittel für die Formanten haben. In der zweidimensionalen Formantfläche 
mit F2 als x-Achse und F1 als y-Achse haben diese folgende Interpretation (vgl. 
Abbildung 27 auf $. 95): Das untere Perzentilmittel für F2 gibt den erwarteten un- 
teren Wert für F2 an. Im Diagramm hat dies die Bedeutung einer links liegenden 
vertikalen Trennlinie, die parallel zur y-Achse (F1) läuft und die x-Achse (F2) im 
Perzentilmittel für F2 schneidet: Es wird erwartet, dass die meisten Punkte rechts 
von dieser Linie liegen. Für die anderen Trennlinien würde entsprechend vorge- 
gangen werden und im Ergebnis entsteht eine rechteckige Form, die den Bereich 


#8 Jm notwendig im Inneren des Dreiecks zu liegen, muss ein Punkt: diesseits aller drei Kanten 
liegen. 
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Abbildung 27: Künstlich geschaffene Datenmenge zur Illustration der Rückfal- 
tungsmethode in Form einer üblichen F1/F2-Formantfläche. Eingezeichnet ist das 
Normtetragon (durchgezogen) und das einhüllende Dreieck (gestrichelt) aus dem es 
durch Abtrennung der Spitze hervorgegangen ist. Ebenso eingezeichnet sind die obe- 
ren und unteren Perzentilmittel für F1 und F2 (gestrichelt grau). Fasst man das 
Dreieck allgemein genug, sind alle Messwerte außerhalb des Dreiecks ‚unerwartet‘ 
und werden tendenziell in dieses rückgefaltet. 


angibt, in dem die meisten Werte zu vermuten sind. In Abbildung 27 sind die vier 
sich aus dem oberen und unteren Perzentilmittel für jeweils F1 und F2 ergebenden 
Trennlinien eingezeichnet. Doch beschreiben diese Trennlinien die Situation offen- 
sichtlich ungenau, denn die erwartete Form ist doch die eines schiefen Dreiecks 
bzw. Tetragons und nicht die eines achsparallelen Rechtecks. So weiß man etwa 
von der linken unteren schrägen Seite des Dreiecks, dass sie die erwartete Trennli- 
nie der Daten nach links unten ist. Es wird erwartet, dass die meisten Daten rechts 
oberhalb der Trennlinie liegen. Entsprechende Erwartungen lassen sich auch für 
die anderen Kanten formulieren. 

Und genau diese Erwartungshaltung liefert den Schlüssel zur automatischen 
Kontrolle und Qualitätssicherung der Messungen im VOKALJÄGER. Ein einfaches 
Maß für Normkonformität einer Messung ist es, auszuzählen, welcher Anteil der 
Formantmessungen bzw. Punkte einer Formantbahn in der F1/F2-Formantfläche 
innerhalb eines Normtetragons oder des Extremdreieck liegt. Hat man nun mehre- 
re Formantkurven zur Auswahl, etwa dadurch, dass ein Stellwert — wie die obere 
Grenzfrequenz in PRAAT - bei der Messung variiert wird (vgl. Abschnitt 3.3.4, 
S.64f.), wird man jenen Kurven den Vorzug geben, die relativ wenige der artiku- 
latorisch unwahrscheinlichen Werte außerhalb des Normbereichs annehmen. 

Dies ist eine automatisierbare Umsetzung der von Thomas (2010, 48) vorge- 
brachten einfachen Grundidee: „Another effective way to check formant readings is 
to know where to expect them to be“. Verwirft man nun unwahrscheinliche Werte 
und fällt auf wahrscheinlichere zurück, stabilisiert sich die Messung. Dies ist ein 
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Abbildung 28: Identifikation von Ausreißern mit dem Extremdreieck und auto- 
matische Korrektur durch Rückfaltung, exemplarisch gezeigt an einem ‚unbekann- 
ten‘ Dialektsprecher (REDE: FraF2). Links: Mit dem VOKALJÄGER automatisch 
ermittelte Formanten ohne Rückfaltung. Gezeichnet ist im Hintergrund das HGI- 
Normtetragon, das männliche HG1-99%-Extremdreieck und ein Rechteck, welches für 
den Sprecher den Bereich zwischen oberem und unterem Perzentilmittel anzeigt (HG1 
ist dieim VOKALJÄGER verwendete hochdeutsche Referenzgruppe). In Schwarz mar- 
kiert sind die Messwerte, die außerhalb des Extremdreiecks liegen und daher extrem 
unwahrscheinlich sind. Rechts: Automatisch errechnete Formanten nach Korrektur 
durch Rückfaltung. Die unwahrscheinlichen Messergebnisse sind nun in einen wahr- 
scheinlicheren Bereich zurückgefaltet worden. Skala in originalen Hertz vor Normali- 
sierung. 


effektives Umgehen mit potentiellen Ausreißern — sie werden in den Bereich der 
wahrscheinlichen Werte zurückgefaltet. Wichtig anzumerken ist, dass die Rückfal- 
tung nur dann effektiv ist, wenn sie durch Stellwertvariationen erreicht werden 
kann. Ergeben alle möglichen Stellwerte immer noch einen Wert außerhalb des 
Normbereichs, verbleibt der Wert außerhalb des Normbereichs. Die Abbildungen 
28 auf S.96 und 29 auf S.97 veranschaulichen die Anwendung. 

Das hier skizzierte Verfahren der Rückfaltung zur Kontrolle von Ausreißern 
kommt im VOKALJÄGER zum Einsatz. Die Methode der Rückfaltung ergänzt die 
Methode der robusten Formantnormalisierung aus Abschnitt 3.6.5, S. 90 f. Zusam- 
men bilden sie die robuste Formantberechnung des VOKALJÄGERS. Im VOKAL- 
JÄGER wird für die Rückfaltung von Ausreißern das geschlechtsspezifische 99%- 
Extremdreieck angesetzt. Somit wird sichergestellt, dass nur extreme Ausreißer 
rückgefaltet werden. Die empirisch ermittelten Eckpunkte finden sich dann in Ta- 
belle 9 auf S. 120. 

Die Rückfaltung im VOKALJÄGER wird wie folgt durchgeführt: Pro Lautseg- 
ment wird geprüft, ob ein Punkt (Fylt], Falt]) in der F1/F2-Ebene, der durch die 
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Abbildung 29: Auswirkung der Rückfaltung auf die Normalisierung. Gezeigt sind 
dieselben Daten wie in Abbildung 28 auf S.96, nun aber nach Normalisierung und 
Rückprojektion. Gezeichnet sind auch die erwarteten Interquartilellipsen für die Eck- 
vokale [ir/a:/u:]) aus HG1 (HG1 ist die im VOKALJÄGER verwendete hochdeutsche 
Referenzgruppe). Das linke Bild ist ohne, das rechte mit Korrektur durch Rückfal- 
tung. Die robuste Lobanov-Normalisierung setzt auf den Perzentilmitteln aus Ab- 
bildung 28 auf. Diese sind aber bei im vorliegenden Fall durch die Ausreißer stark 
verzerrt und erzeugen insbesondere hinsichtlich Fl eine Stauchung der Formantwerte 
in der F1/F2-Ebene (links). Erst die zusätzliche Rückfaltung ermöglicht eine saubere 
Abbildung (rechts). Die robuste Formantberechnung wird im VOKALJÄGER durch 
die Kombination aus zwei Verfahren erreicht, der Rückfaltung und der robusten Be- 
reichsnormalisierung. 
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jeweiligen Formantbahnen F}[t]| und Falt] definiert ist, im Inneren jenes Extrem- 
dreiecks liegt, welches durch das Geschlecht des Sprechers vorgegeben ist. Die 
mathematisch-geometrischen Methoden dazu sind in Jule (2014) und Jethro (2010) 
beschrieben. Dann wird das Verhältnis der Anzahl der Punkte außerhalb des Ex- 
tremdreiecks zu der Anzahl der Punkte innerhalb des Extremdreiecks bestimmt: 


B= d > 1 : außerhalb des Extremdreiecks 
_ TZN\D : innerhalb des Extremdreieicks, 


wobei 7 die Anzahl der Messwerte innerhalb eines Lautsegments ist. Der Prüf- 
wert 3 wird im Kernalgorithmus des VOKALJÄGERs verwendet. Dort werden mit 
verschiedenen Stellwerten errechnete Formantbahnen miteinander verglichen und 
eine optimale bestimmt. In das Optimalitätskriterium geht der Prüfwert 5 ein, um 
Formantbahnen zu ‚bestrafen‘, die stark außerhalb des Extremdreiecks verlaufen. 
Die technischen Details finden sich in Schritt 3.7.4 in Abschnitt 3.7.4 ab S. 105. 


(32) 


3.6.10 Errechnung des Normtetragons und Extremdreiecks 


Mathematischer Einschub: Wie kann das Normtetragon bzw. Extremdreieck in 
der Formantfläche errechnet werden? Mathematisch fällt das Problem in den Be- 
reich der geometrischen Optimierung und der Suche nach geometrischen Formen, 
die eine bestimmte oder maximale Anzahl von Punkten einschließen (O’Rourke 
u.a. [1986], Agarwal/Sharir [1998, 2013] und Mount u.a. [2000]). Denn es geht 
darum, eine geometrische Form so zu bestimmen, dass sie die meisten Punkte der 
Formantfläche abdeckt. Dies soll auch robust geschehen. 

Das Optimierungsproblem lässt sich für den VOKALJÄGER auf die Perzentil- 
mittel aus Abschnitt 3.6.2 ab S. 86 zurückführen. Die Perzentilmittel geben eine 
erwartete untere oder obere Grenze für einen Wertebereich an. Die Kernidee ist 
nun, die Kanten des Normtetragons bzw. Extremdreiecks entsprechend zu definie- 
ren: Die Kante sei die erwartete Grenze der Formantwerte in einer Richtung, die 
senkrecht zu der Kante verläuft. Man erwartet, dass die (meisten) Formantwer- 
te innerhalb — also diesseits der Grenze bzw. Kante - liegen. Zur Modellierung 
des Problems setzt man eine Punktwolke aus Messwerten in der Formantfläche 
an. Diese sei nun von vier Kanten begrenzt, die - als Postulat — die Form eines 
Vierecks haben. Für reale Sprecher wurde schon ein Beispiel in Abbildung 26 auf 
S.93 gezeigt. Zur Motivation des weiteren Vorgehens sei hier auf Abbildung 27 
auf S.95 verwiesen, die eine zur Illustration geschaffene künstliche Datenmenge in 
Form einer Formantfläche darstellt. 

In erster Näherung ist das postulierte Tetragon ein auf dem Kopf stehendes 
Dreieck, dessen Spitze abgetrennt ist. Die Trennlinie sei hier als parallel zu der oben 
liegenden Grundseite des Dreiecks angesetzt. Und es sei angenommen, dass das 
Dreieck nicht schief ist und somit die Spitze des Dreiecks über der Grundseite liegt. 
Die obere Kante des einhüllenden Dreiecks (bzw. des Tetragons) hat Ecken, die 
phonetisch [i] (links) und [u] (rechts) entsprechen. Die untere Kante des Tetragons 
(bzw. die Schnittlinie über der Spitze) entspricht den [a]-Lauten. 
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F2 [Bark] 


Abbildung 30: Die Formantdaten werden in der Formantfläche im Gegenuhrzeiger- 
sinn rotiert, um die Kanten des postulierten einhüllenden Dreiecks zu bestimmen. 
Eine Dreieckskante gilt als gefunden, wenn sie als Grundseite parallel zur y-Achse 
liegt und die Dreiecksspitze nach rechts weist. Die Zahl über dem Diagramm gibt 
den jeweiligen Rotationswinkel in Grad an. Das Dreieck ist mit unterschiedlichen 
Markierungen gezeichnet, um die Rotation optisch besser verfolgen zu können. 
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Systemantwort 
5 
1 


SO 
a 
f 


00 200 
Rotationswinkel [Grad] 


Abbildung 31: Systemantwort des Tests auf eine linke senkrechte Dreieckskante 
(y) in Abhängigkeit der Rotation des Datendreiecks (x). Maxima zeigen die Rotati- 
onswinkel an, zu denen die rotierten Daten das gesuchte Dreiecksmuster aufweisen. 


Es gilt nun, die Kanten des einhüllenden Dreiecks vollautomatisch zu bestim- 
men. Dazu werden die Daten, wie in Abbildung 30 auf S.99 exemplarisch darge- 
stellt, in der Formantebene schrittweise rotiert (Im VOKALJÄGER werden jedoch 
800 anstatt der dargestellten 16 Schritte angesetzt). Die rotierten Daten werden in 
jedem Schritt algorithmisch darauf untersucht, wie passgenau sie ein Dreieck dar- 
stellen, welches seine Grundseite parallel zur y-Achse (hier: F2) hat. Dabei wird 
eine einfache Wesenheit des postulierten Dreiecks verwendet: Nur in einem Drei- 
eck, dessen Grundseite parallel zur y-Achse angeordnet ist und dessen Spitze nach 
rechts zeigt, decken die am weitesten links auf der x-Achse liegenden Punkte den 
gesamten Wertebereich der y-Achse ab. Das extreme Gegenbeispiel ist ein Dreieck, 
dessen Grundseite ebenfalls parallel zur y-Achse ausgerichtet ist, aber dessen Spit- 
ze nach links zeigt. Hier decken die auf der x-Achse am weitesten links liegenden 
Punkte - die Spitze des Dreiecks - nur einen verschwindend geringen Bereich auf 
der y-Achse ab. 


Errechnet man nun das Verhältnis des so ausgewählten y-Wertebereichs der 
x-links liegenden Punkte zum y-Gesamtwertebereich, ergibt sich ein Muster wie in 
Abbildung 31 auf S. 100 dargestellt. Diese Systemantwort des Dreieckstests weist 
für jene Rotationswinkel deutliche Ausschläge auf, die die Daten in die gesuch- 
te Dreieckslage rotieren. Daraus lassen sich somit die gesuchten Rotationswinkel 
ablesen: Im vorliegenden Beispiel ergeben sich etwa 90, 220 und 320 Grad. Mit 
diesen Winkeln können die Kanten des Dreiecks einfach errechnet werden, wenn 
man nun die exakte Lage der Kante über ein Perzentilmittel definiert. Die Kante 
sei — gegeben, dass die Daten in die optimale Dreiecksposition rotiert sind — das 
obere Perzentilmittel der x-Werte (man beachte, dass in vorliegender Darstellung 
die x-Achse invertiert ist und obere Werte links liegen). Die Kante ist somit die 
links liegende Grundseite des Dreiecks. Rotiert man das Dreieck nach Berechnung 
der Kante wieder in seine originale Position zurück, rotiert die Kante mit. Sie kann 
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nun im originalen Wertebereich angegeben werden. Das zeigt die Darstellung 27 
auf S. 95. 

Abschließend kann das einhüllende Dreieck in ein Normtetragon überführt wer- 
den. Die Überführung ist das Kappen der unteren Dreiecksspitze. Die Schnittlinie 
wird hier als parallel zur oberen Grundseite angesetzt. Entspricht die Grundseite 
dem unteren Perzentilmittel, so wird für den Schnitt das obere Perzentilmittel an- 
gesetzt. Man beachte, dass sowohl die obere Kante als auch die Schnittlinie nicht 
notwendigerweise parallel zur x-Achse laufen müssen. Für die Berechnung des Ex- 
tremdreiecks entfällt naturgemäß der Schritt des Kappens der Spitze. Ende des 
mathematischen Einschubs. 


3.6.11 Exkurs: Systematische Lücken 


Eine weitere denkbare Anwendungsmöglichkeit ist das Umgehen mit systemati- 
schen Lücken in den Formantdaten. Ein häufig aufgetretenes technisches Problem 
ist das Ausdünnen von Messwerten in der rechten oberen Ecke des Formantdia- 
gramms um den Vokal [u:] gegenüber der linken mit [i]: Im Deutschen ist [ir] nach 
Aichert u.a. (2005) mehr als dreimal so häufig wie [u:]. Damit lässt sich die rechte 
obere Ecke um [u] und insbesondere die Untergrenze von F2 schwer genau messen. 
Ein ähnliches Problem liegt vor, wenn in einem Dialekt, wie z.B. dem Sächsischen, 
[u:] systematisch fehlt. Ein für einen Sprecher angepasstes Normtetragon erlaubt 
es, die ausgedünnte bzw. nicht vorhandene Ecke zu erschließen. Das Verfahren des 
Normtetragons nutzt dazu die besser populierten Gebiete der Formantfläche und 
das Wissen, dass es eine viereckig einhüllende Form geben muss, zur Extrapo- 
lation. Ein Beispiel ist in Abbildung 32 auf S. 102 exemplarisch dargestellt. Ein 
solches Verfahren ist im VOKALJÄGER noch nicht implementiert und bleibt einer 
zukünftigen Weiterentwicklung vorbehalten. 
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Abbildung 32: Robustheit gegen systematische Defekte des Vokalsystems: Deutlich 
ist zu erkennen, dass die rechte obere Ecke des Tetragons ausgedünnt ist, in welchem 
normalerweise [u] Laute gemessen werden. Die Ursache ist, dass dieser ‚unbekann- 
te‘ obersächsische Sprecher zur Zentralisierung - und damit Eliminierung — des [u] 
neigt. Das Fehlen von Messwerten in jener Ecke ist kritisch, wenn diese als Referenz- 
punkte einer Normalisierung verwendet werden sollen. Die Berechnung eines spre- 
cherabhängigen Tetragons könnte dieses Problem lösen: Es werden nicht die (nicht 
vorhandenen) Messwerte als Bezugspunkt verwendet werden, sondern das Tetragon. 
Diese Erweiterung bleibt einer zukünftigen Form des VOKALJÄGERSs vorbehalten. 
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3.7. Der messphonetische Kernalgorithmus 


Dieses Kapitel führt die einzelnen Bearbeitungsschritte des VOKALJÄGERSs auf und 
zeigt, wie die akustischen Größen ermittelt werden. Technisch ist der VOKALJÄ- 
GER eine Sammlung von selbst entwickelten Algorithmen, die in den Programmier- 
bzw. Skriptsprachen PRAAT, Perl und R geschrieben wurden. In vorliegendem Ab- 
schnitt erscheint nun eine Zusammenfassung und die technische Dokumentation 
der verwendeten Stellwerte. Zur weitergehenden Informationen wird auf methodi- 
sche Textstellen in diesem Dokument verwiesen. 

Der Algorithmus wird auf drei Typen von Daten angewendet: erstens auf eine 
hochdeutsche Trainingsgruppe, zweitens eine gemischte Testgruppe und drittens 
die dialektale Anwendungsgruppe (dazu dann im Einzelnen in Abschnitt 4.1.1 
ab S.112). Für das Training bzw. das Kalibrieren auf das Hochdeutsche weichen 
manche Schritte und Stellwerte von denen im Test und in der Nutzanwendung ab, 
was entsprechend vermerkt ist 

An manchen Stellen verwendet der Algorithmus Stellwerte, die von der Lo- 
gik her beim ersten Durchlauf noch gar nicht bekannt sein können, weil sie auf 
statistischer Auswertung der Ergebnisse des Algorithmus beruhen. Diese Erfah- 
rungswerte ergeben sich aus iterativer Anwendung und werden im Ergebniskapitel 
4 an verwiesener Stelle erläutert. 


3.7.1 Eingangsbemerkungen 


1. Die Messung der phonetischen Rohgrößen — beschrieben in Abschnitt 3.7.2 
unten — wird mit der Phonetiksoftware PRAAT durchgeführt (vgl. S. 44; Boe- 
rsma/Weenink 2015). Der VOKALJÄGER nutzt allerdings nicht die übliche 
interaktive PRAAT Benutzeroberfläche, sondern das eigenständige Programm 
praatcon.exe, welches vollautomatische Skriptprogrammierung erlaubt. 


2. Für die mathematisch numerischen Berechnungen — dokumentiert in den Ab- 
schnitten 3.7.3 bis 3.7.5 unten — wird die Statistiksoftware R verwendet (R 
Development Core Team 2015). Dabei kommen zusätzliche R-Module zum Ein- 
satz, die an den entsprechenden Textstellen referenziert sind. 


3. Zur Steuerung des Datenflusses von PRAAT nach R wird die Skriptsprache Perl 
genutzt (Wall 1987-2012). 


4. Das Sprachsignal muss als Mono Aufnahme vorliegen, die in PRAAT verarbeitet 
werden kann. Technisch ist das eine .WAV Datei. 


5. Das Sprachsignal muss segmentiert sein. Damit ist die Lage der zu untersu- 
chenden Vokale, genauer die Zeitpunkte des Lautanfangs und -endes, bekannt. 
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Die technische Darstellung der Segmentierung ist das .textGrid Format von 
PRAAT. 


3.7.2 Messen der Rohparameter 


1. Die Formanten werden in PRAAT mit der Funktion To Formant (Burg) errech- 
net. PRAAT verlangt nach der oberen Grenzfrequenz als Stellwert und dieser 
Wert hat erheblichen Einfluss auf das Ergebnis (vgl. Abschnitt 3.3.4, 8. 64£.). 
Deshalb werden die oberen Grenzfrequenzen von 4.000Hz bis 6.000Hz in 21 
Schritten zu 100 Hz durchgespielt und in PRAAT als Stellwert gesetzt. Somit 
ergeben sich 21 Einstellungen i, die jeweils mit einer oberen Grenzfrequenz von 
f; = 4.000 + 100: korrespondieren, wobei © = 0...20. Für jede Einstellung 
werden die Bahnen F‘;;;\t| der ersten vier Formanten j =1...4 in PRAAT er- 
rechnet. Die anderen PRAAT Stellwerte bleiben fix und es werden die PRAAT 
Standardwerte angesetzt: 5 Formanten; Schrittweite der Zeitschritte t: 2 ms; 
25 ms Gaußfenster und 50Hz Präemphase. Die Bahnen werden jeweils vom 
Vokalanfang bis zum Vokalende errechnet. 


2. Völlig analog zu den Formantbahnen werden die Bahnen der Bandweiten Bi 
bis B4, hier als B,,;[t| bezeichnet, errechnet. 


3. Es wird die (eine) Intensitätsbahn /o[t] errechnet, wobei die PRAAT Stellwerte 
in der Funktion To Intensity entsprechend gewählt sind: 2 ms Schrittweite 
und 75Hz Pitch-Floor (vgl. Abschnitt 3.4.2, S. 72£.). 


4. Es wird die (eine) Bahn der Grundfrequenz Fo[t] errechnet, wobei die PRAAT 
Stellwerte in der Funktion To Pitch entsprechend gewählt sind: 75 Hz Pitch- 
Floor; 600 Hz Pitch-Ceiling (vgl. Abschnitt 3.4.1, S. 72f.). 


3.7.3 Vorbereiten der Rohdaten 


1. Alle Formanten und Bandweiten werden mit Formel (12), S.76, von der physi- 
kalischen Hertz Skala auf die auditorische Skala nach Bark transformiert. Die 
Bahnen der Formanten F',,[t| und Bandweiten B;;|t|, wenn sie weiter unten als 
Variablen referenziert werden, sind somit immer in Bark zu lesen. 


2. Für jeden Laut wird nur die 60% Kernregion berücksichtigt und die Bahnen 
aus dieser Region extrahiert (vgl. S.54). Damit wird 20% des Lautanfangs und 


20% des Lautendes verworfen, um Übergangseffekte zu minimieren. 


3. Eventuell vorkommende Löcher bzw. fehlende Messdaten in der Bahn der 
Grundfrequenz werden interpoliert (vgl. Abschnitt 3.4.1, S. 72£.). 
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3.7.4 Bestimmung der optimalen Formanten 


Nachfolgende Schritte werden lautintrinsisch, also für jeden Laut separat, durch- 
geführt. Schritt 1 bereitet den eigentlichen Optimierungsalgorithmus vor, der erst 
mit Schritt 2 beginnt. 


1. Es wird mit Formel (32), S.98, das Verhältnis 3 der Werte einer Formantkur- 
ve bestimmt, die sich außerhalb des ermittelten Extremdreiecks befinden. Das 
Extremdreieck wurde dabei nach Geschlecht über alle Sprachproben betonter 
Monophthonge der Trainingsmenge HG1 kalibriert (zu den numerischen Eck- 
punkten vgl. Tabelle 9 auf S. 120). Der geschlechtsabhängige Prüfwert 3 steuert 
die Rückfaltung und wird in Schritt 3 eingesetzt. 


2. Mit diesem Schritt beginnt der eigentliche Optimierungsalgorithmus. Für jede 
der Kernformant- und Bandweitenbahnen wird mit R und Formel (5), S.60, 
eine DCT-Näherung dritter Ordnung 


ie = Frl] 
Bl] = Bil] 


errechnet. Damit sind auch die ersten drei DCT-Koeffizienten G;,;[1], G;il2] 
und G;;[3] für die Formantbahnen bekannt (vgl. Formel (1) von S. 58). 


3. Darauf wird für jede der Einstellung © bzw. für jede obere Grenzfrequenz f; ein 
kombinierter Passfehler 


&=10-(1-B)-log (@-e(R) + (1-0) -e(B;)) (33) 


in dB bestimmt. Hier wird Formel (7), S. 61, für die Bandweitenbahnen genau- 


A 


so wie für die Formantbahnen angesetzt, um den jeweiligen Passfehler e(B;) 
bzw. e(F;) zu bestimmen. Der Passfehler e(F;) ist für jede Einstellung i ein 
aggregiertes Fehlermaß über die drei Formantkurven F' ;lt], Fa,;lt]| und F3;lt] 
hinweg, was für die Bandweitenbahnen entsprechend gilt. Man beachte, dass 
hier sowohl Formanten als auch Bandweiten in Bark eingehen. Der Stellwert « 
steuert, mit welchem Gewicht Formantbahnen gegenüber den Bandweitenbah- 
nen in den kombinierten Passfehler eingehen. Im VOKALJÄGER wird den For- 
manten ein starkes Gewicht mit & = 0,95 gegeben. Der Prüfwert 5 aus Schritt 1 
wird in der Berechnung von g; genutzt, um Formantkurven zu ‚bestrafen‘, die 
(teilweise) artikulatorisch unwahrscheinliche Werte annehmen. Man beachte, 
dass ein Passfehler von O0 dB auf einer dB Skala maximal ist und sich dieser er- 
gibt, wenn die gesamte Formantkurve außerhalb des jeweiligen Extremdreiecks 
liegt (dann ist 8 = 1; vgl. Formel (32), $.98 und Abschnitt 3.6.9, S.93). Im 
Trainingsschritt ist die Rückfaltung ausgeschaltet und es wird pauschal 5 = 0 
gesetzt. 
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4. Für jede der Formant- und Bandweitenbahnen in DCT-Näherung werden ein- 
fache Mittelwerte 


A 
’ 


Br = m{F,| 


wo 


DD: 
> 
| 
AS 
= 
Tun) 
> 
o 
So 
= 
oo 


über die Zeit t errechnet. 


5. Im VOKALJÄGER ist eine lautunabhängige Form der Scheitelpunkt-Methode 
implementiert (vgl. S.55). Dazu wird versucht, für jede Einstellung ö den Zeit- 
punkt t} des Formantzielwerts aus dem Verlauf der F1- oder F2-Formantbahn 
zu bestimmen. Der erste Versuch ist das Ablesen am Maximum von Fl 


lt] — max{F\.[£]} . 


Der Versuch gilt als Erfolg, falls sich das Maximum im Inneren der Vokalbahn 
befindet, also nicht an den Rändern erreicht wird: 6 < t# < 1-0. Der Stellwert 
wird auf 0 = 0,1 gesetzt. Damit gilt ein Maximum als gefunden, so es sich nicht 
in den ersten und nicht den letzten 10% des Lauts befindet (man beachte, dass 
alle Berechnungen darüber hinaus vorher schon in Schritt 3.7.3, 2, auf den 60% 
Kern eingeschränkt wurden). Im Fall des Scheiterns des ersten Versuchs wird 
ein Ablesen am Minimum von F2 versucht: 


Fri [#] = min{Pr.[tl} . 


Abermals wird nur im Inneren der Vokalbahn gesucht (Stellwert 0). Ist auch 
dieser Versuch gescheitert, muss man davon ausgehen, dass die Bahn kein deut- 
liches Maximum oder Minimum in ihrem Inneren aufweist und vermutlich flach 
oder geradlinig geformt ist. In diesem Fall ist die Scheitelpunkt-Methode indif- 
ferent und es wird an der Mitte extrahiert: 


eh: 


6. Es wird ein Plausibilitätstest durchgeführt: Einstellungen © bzw. obere Grenz- 
frequenzen f, die Bahnen ergeben, die sehr grob gegen empirische Erfahrungs- 
werte verstoßen, werden mit dem Prüfwert 


Se 0: Rs; >12. und Bi; < Ba; < vBii 
' 1 : sonst 


entsprechend markiert (A = 1 markiert den Verstoß). Dabei wird ein Test auf 
einen Minimalwert von im Mittel 12 Bark (1.670Hz) für F3 durchgeführt. Des 
Weiteren wird geprüft, ob die zweite Bandweite B2 nicht zu stark von der ersten 
Bandweite Bl abweicht, was durch den Parameter v geregelt ist. Dieser wird 
hier mit v = 4 großzügig gewählt, was B2 zwischen 25% und 400% von Bi 
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verortet (vgl. S.45). Der Prüfwert A wird später in Schritt 9 bei der Auswahl 
der optimalen Bahnen verwendet. 


Im Trainingsschritt ist diese Plausibilitätsprüfung ausgeschaltet und es gilt 
pauschal A = 0. Im Testschritt und der Anwendung wird die Berechnung wie 
oben beschrieben durchgeführt. 


7. Es wird die Einstellung i* bestimmt, für die der Passfehler e; aus Formel (33) 
von S. 105 minimal ist: 
&x = minfg;}. 


Damit sind die optimalen Formantbahnen F'; ;-[t]| und Bandweitenbahnen 3; ;-[t] 
gefunden: Es sind die, die mit der oberen Grenzfrequenz f;» als Stellwert in 
PRAAT gemessen wurden. Numerische Ergebnisse werden Abschnitt 4.2.3 ab 
S. 117 dokumentiert. 


8. Um die numerische Stabilität zu erhöhen, wird jedoch nicht nur diese eine op- 
timale PRAAT Messung mit dem Stellwert f;» als obere Grenzfrequenz heran- 
gezogen, sondern alle Messungen, die einen ähnlich niedrigen Passfehler haben. 
All diese Einstellungen seien mit I bezeichnet und es gelte 


er (1 =) "Ex. 


Dabei ist Y ein weiterer Stellwert, der auf 0,02 gesetzt wurde: Es werden alle 
PRAAT Messungen als verwendbar angesehen, deren Passfehler nicht mehr als 
2% von dem optimalen Passfehler abweichen. 


9. Nun werden aus allen verwendbaren Formantbahnen die Formantzielwerte ab- 
gelesen. Mathematisch bestimmt man die Formantzielwerte, indem man sie 
zum gewünschten Zeitpunkt aus der DCT-Näherung abliest. Dann wird über 
die Formantzielwerte aller verwendbaren Einstellungen / gemittelt: 


FTj = HieInı=o {Full} 
Fun; = MWiernxa=o [F{pl) 
Pr; = MiEING=0 [F,l2]) 


Fi = kWiernx=0t le) (34) 
Es werden Zielwerte für alle Formanten j = 1...4 zu fixen Zeitpunkten, 
zuerst am ersten Drittel (T: %) und dann am Mittelpunkt (H: %), extra- 
hiert (vgl. S.55). Des Weiteren wird an Zeitpunkten t abgelesen, die mit der 
Scheitelpunkt-Methode in Schritt 5 bestimmt wurden (P). Das Ganze wird mit 
F,; durch ein einfaches Zeitmittel ergänzt (A). Die Mittelwertbildung läuft 
jeweils unter den Nebenbedingungen ab, die durch den Prüfwert X; bestimmt 
sind: Es werden nur Bahnen herangezogen, die den Bedingungen aus Schritt 
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6 genügen, also keine groben Abweichungen von der Norm aufweisen (d.h. 
A; = 0). Die Bestimmung der optimalen Formantbahn durch Minimierung des 
Passfehlers in Schritt 7 erfüllt nur die notwendige Bedingung einer möglichst 
stetigen Messwertfolge ohne Kontinuitätsbrüche. Die hinreichende Bedingung, 
dass die Bahnen auch zu einem großen Grad grob plausible Werte annehmen, 
wird durch den Prüfwert A; erfüllt. Für den Ausnahmefall, dass keine Kurven 
die Nebenbedingungen des Prüfwerts A, erfüllen sollten, wird diese Nebenbedin- 
gung gelockert. Der Prüfwert A bevorzugt plausiblere Werte bei der Auswahl: 
Anschaulich kann man davon sprechen, dass unplausiblere Werte im Bereich 
der plausibleren rückgefaltet werden. Um keine unerwünschte Verfälschung zu 
erhalten, wird diese sogenannte Rückfaltung im Training ausgeschaltet, aber im 
Test und in der Anwendung zugeschaltet. Die Rückfaltung unplausibler Werte 
ist eine Methode, inhärent und automatisch mit Ausreißern umzugehen. 


10. Die Berechnung für die Bandweiten erfolgt entsprechend. 


11. Das Vorgehen zur Bestimmung der DCT-Koeffizienten ist analog. Auch hier 
wird entsprechend gemittelt 


G[k] = wier {Gill}: 


3.7.5 Berechnung der akustischen Größen 


1. Es werden nun die robust normalisierten Varianten der Formanten errechnet. 
Dazu werden die in den vorherigen Abschnitten eingeführten Formeln verwen- 
det und dort die aus den DCT-Näherungen mit Formel (34) von S. 107 berech- 
neten Formantzielwerte eingesetzt. Damit ergeben sich jeweils vier Varianten 
der normalisierten Formanten, abhängig davon, welche Methode zur Extrakti- 
on des Zielwerts in Formel (34) von S. 107 gewählt wurde. Die Formeln sind hier 
der Übersichtlichkeit halber in einfacher Schreibweise wiederholt: Anstatt eines 
methodenabhängigen Fr.;, Fr, j, Fpj oder Fa; steht in den Formeln verkürzt 
nur F;. Im Einzelnen: 


(a) Fants effektiver Formant 


VE De 


Bee 
a BB) 


(vgl. Abschnitt 3.5.4, S. 80f.). 


(b) Syrdal Deltas 
D,=F,— F-ı 


für alle Formanten j=1...4 (vgl. Abschnitt 3.5.5, S. 81f.). 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


Der messphonetische Kernalgorithmus 109 


(c) Normalisierte Formanten nach der Methode von Gerstman in der robusten 
Variante 
F- Qutf} 
QntKs} 
für alle Formanten j=1...4 (vgl. Abschnitt 3.6.5, S. 90£.). 


(d) Normalisierte Formanten nach der Methode von Lobanov in der robusten 


Variante 
‚Bu u F - Qu{F}} 
QziFj} Qg-tF;} 


für alle Formanten j=1...4 (vgl. Abschnitt 3.6.7, S. 91£.). 


2. Es werden weitere Größen errechnet und robust MAD-normalisiert, die nicht 
auf Formanten basieren. Im Einzelnen: 


(a) Grundfrequenz FO (vgl. Abschnitt 3.4.1 ab S. 72). 
(b) Intensität I und akkumulierte Intensität e (vgl. Abschnitt 3.4.2 ab S. 72). 
(c) Lautdauer (vgl. Abschnitt 3.4.3 ab S. 73). 
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Kapitel 4 


Messphonetische Ergebnisse 


Zusammenfassung: Dieses Kapitel präsentiert die Ergebnisse der Anwendung 
der messphonetischen Algorithmen des VOKALJÄGERSs auf das Hochdeutsche. 
Dazu wird das Kiel-Korpus of Read Speech exemplarisch mit dem VOKALJÄ- 
GER messphonetisch untersucht und dokumentiert. Die Ergebnisse für die 
ersten beiden Formanten sind in Abbildung 56 auf S.151 dargestellt und ent- 
sprechen dem für das Hochdeutsche Erwarteten. Die akustischen Größen des 
Hochdeutschen werden auch mit einer Referenzaufnahme der Kardinalvokale 
verglichen. Die mit dem VOKALJÄGER gemessenen Muster für das Hoch- 
deutsche decken sich mit denen von Vergleichsmessungen (Abschnitt 4.6.4 ab 
S.159). Im Ergebnis ist somit der VOKALJÄGER phonetisch auf das Hoch- 
deutsche kalibriert, was eine Voraussetzung für die nachfolgenden Klassifika- 
tionsschritte ist. Die hier gewonnenen Statistiken, insbesondere für die For- 
manten, sind der hochdeutsche Eichpunkt für die Untersuchung von dialek- 
talen Tondokumenten und deswegen ausführlich in Tabellen und Diagrammen 
dokumentiert (Abschnitt 4.6.1 ab S.150). 
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A.1l Das Tonmaterial 


4.1.1 Einführung und Gruppieren der Daten 


In Kapitel 3, S.35f., und insbesondere in Abschnitt 3.7, S. 103£., wurde der phone- 
tisch-algorithmische Messapparat des VOKALJÄGERS theoretisch eingeführt und 
exemplarisch erläutert. In diesem Kapitel geht es um die Kalibrierung des VOKAL- 
JÄGERSs als messphonetisches Werkzeug auf hochdeutsches Tonmaterial. Auf die 
so gewonnenen Erkenntnisse setzt dann in Kapitel 5 ab S. 169 der Klassifikationsal- 
gorithmus auf. Beides kommt dann in Kapitel 9 ab S. 283 als vollendetes Werkzeug 
bei Sprachaufnahmen des Frankfurterischen und anderen deutschen Dialekten zum 
gewünschten Nutzeinsatz. Die in vorliegendem Kapitel gewonnenen Messergebnis- 
se haben zum einen intrinsischen Wert, da sie Aufschluss über die Phonetik des 
Hochdeutschen geben. Nun ist dies nichts wesentlich Neues. Aber der Abgleich 
mit schon publizierten Ergebnissen bestätigt das Funktionieren der vollautomati- 
schen Berechnungen ohne händisches Eingreifen. Des Weiteren wird gezeigt, wie 
die Stellwerte des VOKALJÄGERS gesetzt und optimiert werden. 

Der VOKALJÄGER wird mit den Daten einer hochdeutschen Trainingsgruppe 
kalibriert und mit Daten aus einer Testgruppe getestet. Die eigentliche Nutzung er- 
folgt dann mit dialektalen Daten (Kapitel 9 ab S. 283). Für das Hochdeutsche wird 
als Grundlage und Trainingsmaterial das Kiel-Korpus angesetzt, das im folgenden 
Abschnitt 4.1.2 ab S. 113 beschrieben wird. Hier wird es mit dem Kürzel HG be- 
zeichnet (für High German). Das Kiel-Korpus ist für die Kalibrierung in zwei Teile 
geteilt, einen ersten größeren zum Training (Kalibrieren) des VOKALJÄGERS - im 
Folgenden als HG1 bezeichnet - und einen zweiten kleineren zum Testen: HG2. Die 
Testgruppe HG2 enthält Sprecher und Sätze, die in HG1 nicht vorkommen. Wäh- 
rend des Trainings wird allerdings HG1 niemals in seiner Gesamtheit angesetzt, 
um eine Überadaption an HG1 zu vermeiden. Die hierbei verwendete Trainings- 
methode der k-fold cross-validation wird in Abschnitt 5.4, S. 206 f., eingeführt und 
erläutert. 

Eine zweite Testgruppe, die Ergänzungsgruppe MSC (miscellaneous), ergänzt 
HG1 und HG2, um zu testen, wie sich der VOKALJÄGER mit Daten verhält, die 
fundamental unterschiedlich zu jenen Daten sind, auf die er kalibriert wurde. MSC 
enthält die Kardinalvokale, gesprochen von Daniel Jones (siehe allgemein hierzu 
die Abschnitte 2.2.1, S. 20, sowie 3.2.2, S. 42). 

Die hochdeutschen Gruppen HG1 und HG2 sowie die Ergänzungsgruppe MSC 
enthalten etwa zehntausend monophthongische Vokalproben, die vollautomatisch 
prozessiert werden: Auf händische Nachbearbeitung wurde bewusst verzichtet. Alle 
akustischen Größen, insbesondere die Formantzielwerte, wurden mit der Methode 
des VOKALJÄGERSs aus Abschnitt 3.7, S. 103f., bestimmt. 
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4.1.2 Das Kiel-Korpus als hochdeutsche Referenz 


Zusammenfassungen zum Kiel-Korpus finden sich in Kohler (1992a) und Kohler 
(1996). Die Sprachdaten wurden dem PHONDAT 90 Material des Kiel-Korpus 
für gelesene Sprache entnommen (IPDS [1994] und Thon/Dommelen [1992]). Das 
Kiel-Korpus ist vollständig segmentiert und in der maschinenlesbaren IPA-Varian- 
te SAMPA phonematisch transkribiert (Kohler [1992a], Kohler [1992b] und Kohler 
[1994, 20-21]). Die dort verwendete Codierung bzw. Klassifikation wird von Pät- 
zold/Simpson (1997, 222) als „maximal Standard German“ beschrieben. 

Insgesamt wurden 25 Sprachproben der 100 Berliner Sätze (BE), der 100 Mar- 
burger Sätze (MR) und der 63 Kohler Sätze (KO) ausgewählt. Diese Sprachproben 
umfassen für die entsprechenden Satzgruppen das gesamte in IPDS (1994) publi- 
zierte Material und sind in Thon/Dommelen (1992, 61-67 und 69-70) detailliert 
dokumentiert. Die 25 Sprachproben stammen von den 21 in Tabelle 6 auf S. 114 
aufgeführten Sprechern. 10 davon sind weiblich und 11 männlich. Die hochdeut- 
schen Sprachproben werden auf die Gruppen HG1 und HG2 verteilt, wobei HG1 
ausschließlich zum Training und zur Kalibrierung des VOKALJÄGERs verwendet 
wird und HG2 die hochdeutsche Testgruppe bildet. HG1 und HG2 enthalten nur 
die Marburger und Berliner Sätze, HG2 zusätzlich noch ein anderes Satzkorpus, 
die Kohlersätze. 

Die originalen Rohdaten des Kiel-Korpus werden mit R und Perl so vorpro- 
zessiert, dass der Kernalgorithmus des VOKALJÄGERSs aus Abschnitt 3.7, S. 103£., 
diese verarbeiten kann (R Development Core Team [2015], Ligges [2014] und Wall 
[1987-2012]). Insbesondere werden die von PRAAT benötigten .WAV Sprachdateien 
und .textGrid Segmentierungsdateien automatisch generiert. Aus HG1 und HG2 
werden etwa zehntausend betonte Monophthonge [ir/1/er/e:/e/a/a:/o/o:/v/u:] so- 
wie unbetonte Schwavokale [o] und [e] extrahiert. Die Verteilung der Lauthäufig- 
keiten findet sich in Tabelle 7 auf S. 115. 


4.1.3 Jones Kardinalvokale 


Daniel Jones sprach 1956 im Alter von 75 Jahren seine Kardinalvokale auf vier 
Schallplattenseiten zu je drei Minuten, um eine definitive Audioreferenz zu schaffen 
(Jones 1956, 8). Er schreibt in der Beilage zu den Schallplatten: 


„Cardinal Vowels can only be learnt from a teacher who knows how to make them or from a 
gramophone record or tape record. It is for the purpose of making these vowels widely known 
that these [...] records have been prepared.“ 


Aufgenommen wurden damals, jeweils lang und kurz, die 8 primären Kardinalvoka- 
le [i/e/e/a/a/>/o/ul, die 8 sekundären Kardinalvokale [y/o/e/&/p/a/x/u] sowie 
die zwei zusätzlichen Vokale [i] und [#]. Die mittlerweile digital verfügbaren Origi- 
nalaufnahmen wurden mit dem VOKALJÄGER vermessen, da sie den natürlichen 
und ultimativen Bezugspunkt aller Vokaluntersuchungen darstellen. Ein Vergleich 
mit dem Hochdeutschen findet sich dann in Abschnitt 4.6.2 ab S. 154. 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


114 Messphonetische Ergebnisse 


Gruppe Sprecher Geschlecht Alter Korpus betont unbetont Summe 


HG1 Kol m Jung BE 233 131 364 
K02 w Jung BE 234 132 366 

K03 m Jung BE 236 128 364 

K04 w Jung BE 237 158 395 

K05 m Jung BE 236 147 383 

K06 w Jung BE 236 134 370 

K07 m Jung MR 270 168 438 

K08 w Jung MR 212 185 457 

K09 m Jung MR 270 192 462 

K10 w Jung MR 270 161 431 

Kil m Jung MR 270 161 431 

K12 w Jung MR 268 157 425 

K63 m alt BE 226 126 352 

K64 w alt BE 235 134 369 

K65 m alt BE 236 149 385 

K67 m alt MR 271 176 447 

K68 w alt MR 272 220 492 

K’70 w alt MR 272 192 464 

4.813 3.007 7.820 

HG2 K61 m alt MR 272 188 460 
BE 235 151 386 

KO IX 158 335 

K62 w alt MR 212 165 437 

BE 236 133 369 

KO 177 140 sit 

1.369 935 2.304 

MSC DJCV m alt 382 0 382 


Tabelle 6: Die Sprecher der hochdeutschen Trainingsgruppe HG1, der hochdeut- 
schen Testgruppe HG2 und der Ergänzungsgruppe MSC. Die Korpora sind die der 
Berliner (BE), Marburger (MR) oder Kohler (KO) Sätze. Die Zahlen geben die je- 
weiligen Häufigkeiten betonter und unbetonter Vokale an. 
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HG1 HG2 MSC alle 
w m w+m w m w+m m 

i 0 0 0 0 0 0 20 20 
1 224 246 470 65 69 130 0 600 
I 258 289 547 75 75 150 0 697 
e 0 0 0 0 0 0 23 23 
e! 246 267 813 69 69 138 0 651 
& 318 390 668 8l 8 162 23 853 
er 45 45 90 22 22 44 0 134 
a 3ol 382 733 92 91 183 23 939 
a! 209 232 441 64 64 128 0 969 
a 0 0 0 0 0 0 34 34 
ß) 8 90 171 26 26 52 3l 254 
o 0 0 0 0 0 0 3l 3l 
o! 122 130 292 36 36 72 0 324 
0) 91 98 189 24 24 48 0 237 
u 0 0 0 0 0 0 19 19 
u! 151 165 316 43 43 86 0 402 
y 0 0 0 0 0 0 17 17 
y! 61 69 130 28 28 86 0 186 
Y 48 54 102 23 23 46 0 148 
A 0 0 0 0 0 0 13 13 
[0 81 90 171 27 27 54 0 225 
© 10 10 20 10 10 20 13 93 
@ 0 0 0 0 0 0 12 12 
D 0 0 0 0 0 0 20 20 
A 0 0 0 0 0 0 12 12 
x 0 0 0 0 0 0 27 27 
u 0 0 0 0 0 0 22 22 
i 0 0 0 0 0 0 22 22 
u 0 0 0 0 0 0 20 20 
o* 186 174 360 290 348 638 0 998 
e) 812 841 1.653 0 0 0 0 1.693 
e* 118 146 264 148 149 297 0 o6l 
® 357 373 730 0 0 0 0 730 


3.769 4.051 7.820 1.123 1.181 2.304 382 10.506 


Tabelle 7: Die Häufigkeiten der Laute in der hochdeutschen Trainings- und Test- 
gruppe des Kiel-Korpus (HG1, HG2) nach Geschlecht (w/m). Hinzugefügt ist die 
Ergänzungsgruppe MSC, die die Kardinalvokale von Daniel Jones (m) enthält. Die 
Anordnung folgt der Nummerierung der Kardinalvokale. Die mit x gekennzeichneten 
Reduktionsvokale [o/e] haben eine vergleichsweise hohe Intensität und spielen beim 
Training des VOKALJÄGERS in Abschnitt 5.3.3 ab S. 197 eine Rolle. 
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4.2 Initialkalibrierung des VokalJägers 


4.2.1 Durchführung der Messung 


Die Messung folgt den Prozessschritten aus Abschnitt 3.7, S. 103£. So nicht anders 
angegeben, sind die dargestellten Formanten am Ys-Punkt nach DCT-Glättung 
extrahiert worden (das entspricht der Methode ‚T‘ aus Schritt 9 auf S.107 und 
wurde gewählt, um den Einfluss des Folgekonsonanten zu minimieren; vgl. hierzu 
auch S. 55). Die Regelnormalisierung für Formanten ist die der robusten Lobanov- 
Methode aus Abschnitt 3.6.7, S.91f., und für andere Größen die MAD-Methode 
aus Abschnitt 3.6.6, S.91f. Berechnungen für HG1 finden ohne Rückfaltung statt 
(vgl. Abschnitt 3.6.9, S.93£.). Diese Methode kommt erst in den Testgruppen 
HG2 und MSC sowie dem späteren Nutzeinsatz bei dialektalen Tonaufnahmen zur 
Anwendung. 


4.2.2 Darstellung der Messergebnisse 


Dem Vorgehen in der Experimentalphysik folgend, werden Messergebnisse auf eine 
niedrige Zahl signifikanter Stellen gerundet niedergeschrieben. Es erscheint unsin- 
nig, eine vermeintlich hohe Genauigkeit durch bloßes Niederschreiben der numeri- 
schen Ergebnisse mit einer willkürlich hohen Stellenzahl zu suggerieren, die nicht 
im Bezug zur statistischen Unsicherheit der Messung steht. Die Zahl der signifi- 
kanten Stellen ist durch die Größenordnung des statistischen Fehlers definiert (vgl. 
Anhang A.2.4 ab S. 439). In Tabellen wird eine einheitliche Darstellungsform pro 
Spalte gewählt, womit im Einzelfall nicht signifikante Nullziffern auftreten können. 

Der für die Rundung angesetzte statistische Fehler ist für Einzelwerte die nor- 
male Standardabweichung, der MAD (vgl. Formel (27) von S.91) oder für kom- 
plexe Größen ein mittels Bootstrapping ermittelter Fehler (vgl. Anhang A.2.1 ab 
S.438). Steht die Streubreite der Messwerte im Vordergrund, werden in der Re- 
gel die Quartile notiert: das 25%-Perzentil P25, das 50%-Perzentil bzw. Median 
P50 und das 75%-Perzentil P75 (vgl. auch Abschnitt 3.6.2, S.86£.). Für die Run- 
dung wird als statistischer Fehler hier die Hälfte des Interquartilbands (also der 
Abstand zwischen P75 und P25) angesetzt. Der statistische Fehler pflanzt sich 
durch Berechnungen fort (vgl. Abschnitt A.2.6 auf S. 441). Grafische Darstellung 
der Statistik sind übliche Boxplots (vgl. Anhang A.2.2 ab S. 438) oder Violindia- 
gramme (vgl. Anhang A.2.3 ab S. 439). Übliche Formantdiagramme werden ebenso 
eingesetzt (vgl. Anhang A.3.2 ab $. 446). 

Sollen Unterschiede zwischen Verteilungen von Messwerten beurteilt werden, 
ergeben sich verschiedene Möglichkeiten. Ein übliches Verfahren ist es, die Mit- 
telwerte der Verteilungen zu vergleichen und mit einem t-Test zu überprüfen, ob 
und auf welchem Niveau der Unterschied signifikant ist (vgl. Anhang A.2.5 auf 
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S. 440). Für abgeleitete Größen, wie z.B. den Perzentilmitteln, die nicht annä- 
hernd normalverteilt sind, eignet sich der t-Test weniger. Hier bietet sich ein Test 
auf Überlappung mittels Bootstrapping errechneter Vertrauensintervalle an (vgl. 
Anhang A.2.1 auf S.438). Eine andere Möglichkeit ist die Berechnung des Über- 
lappungskoeffizienten zweier Verteilungen (vgl. Anhang A.2.7 auf S. 441). 


4.2.3 Statistik des Stellwerts Obere Grenzfrequenz 


Der Messalgorithmus des VOKALJÄGERSs findet die optimale(n) Formantbahn(en) 
durch Variation des Stellwerts der oberen Grenzfrequenz f; in PRAATs LPC-Al- 
gorithmus in einem Bereich von 4.000 bis 6.000Hz (vgl. Abschnitt 3.3.4, $. 64f., 
und Schritt 7, S.107). Im Ergebnis verwendet somit der VOKALJÄGER keine fi- 
xen geschlechtsspezifischen Stellwerte für die obere Grenzfrequenz (üblich sind mit 
500 Hz Unterschied 5.000 Hz für Männer und 5.500 Hz für Frauen), sondern einen 
dynamisch adaptiven Stellwert. 

Wie sehr weichen diese adaptiven oberen Grenzfrequenzen von den üblichen 
Werten ab? Dazu wurden die im VOKALJÄGER über HG1 automatisch angesetz- 
ten oberen Grenzfrequenzen untersucht. Die Statistik ist in Tabelle 8 auf S.118 
zusammengefasst. Einblick in die Verteilungen liefert Abbildung 33 auf S. 118. Es 
zeigt sich, dass wie erwartet die oberen Grenzfrequenzen für Frauen höher liegen 
als für Männer — was seinen rein physikalischen Grund in der durchschnittlich ver- 
kürzten Länge des Vokaltrakts bei Frauen hat. Es errechnet sich für Frauen ein 
Mittel von 5.300Hz und für Männer von 4.900Hz. Dies ergibt einen Unterschied 
von etwa 400 Hz gegenüber den üblichen 500 Hz. Die Abweichung der Mittelwerte 
ist signifikant (p-Wert < 2,2% 1016). Somit liegen im Mittel die vom VOKALJÄGER 
ermittelten Werte in der Größenordnung der Lehrbuchwerte, doch erlauben sie zum 
Teil deutliche Variationen. Abbildung 34 auf S. 118 zeigt die Variation nach Vokal. 
Runde Vokale tendieren zu niedrigeren oberen Grenzfrequenzen, wobei das Muster 
für Männer deutlicher ist als für Frauen. Die hier gemachten Beobachtungen de- 
cken sich mit dem vergleichbaren Experiment aus Escudero/Boersma (2009, 1382), 
bei dem ebenfalls PRAATs Stellwert der oberen Grenzfrequenz variiert wurde. Die 
Autoren finden einen Median von 4.595 Hz für Männer und 5.450Hz für Frauen. 
Sie beobachten ebenfalls Unterschiede nach Vokalklasse: Bei ihnen erscheint ebenso 
[u] und [o] mit niedrigerer Grenzfrequenz. Die Optimierungsalgorithmen weichen 
im Konzept allerdings deutlich voneinander ab und somit ist nur die Tendenz ver- 
gleichbar””. 


#9Der VOKALJÄGER arbeitet mit einer lautintrinsischen Passfehlerminimierung, das Ver- 
gleichsverfahren mit einer lautextrinsischen globalen Varianzminimierung. 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


118 Messphonetische Ergebnisse 


Geschlecht u [02 m 
weiblich 5.200 +500 5.300 
männlich 4.900 =+400 4.900 


Tabelle 8: Statistik der oberen Grenzfrequenz (Mittelwert u, Standardabweichung 
co, Median m). 
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Abbildung 33: Verteilung der adaptiven oberen Grenzfrequenz, wie vom VOKAL- 
JÄGER über HGl1 angesetzt, nach Geschlecht. Die adaptive Grenzfrequenz für Frauen 
liegt erwartungsgemäß im Mittel (Raute) und Median (Strich) über der der Männer. 
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Abbildung 34: Verteilung der adaptiven oberen Grenzfrequenz, wie vom VOKAL- 
JÄGER über HG1 angesetzt, nach Geschlecht und Vokal. Für gerundete geschlossene 
Vokale (hier dunkel markiert), z.B. [y:], werden tiefere obere Grenzfrequenzen ange- 
setzt als für offene, z.B. [a]. 
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Abbildung 35: Alle betonten Monophthonge der HG1-Trainingsgruppe in der 
F1/F2-Ebene. Eingezeichnet ist das Normtetragon sowie das 99%-Extremdreieck 
über alle Sprecher in HG1. Linkes Bild: Männliche Sprecher sind hellgrau, weibli- 
che dunkelgrau eingefärbt. Rechtes Bild: dieselben Daten mit Fokus auf Darstellung 
des Normtetragons und Extremdreiecks. 


4.2.4 Kalibrierung des Normtetragons und Extremdreiecks 


Über alle betonten Vokale der Trainingsgruppe HG1 hinweg werden das Norm- 
tetragon und die Extremdreiecke mit der Methode aus Abschnitt 3.6.10, S. 98f., 
berechnet. Das Ergebnis ist in Abbildung 35 auf S. 119 dargestellt. Das Extrem- 
dreieck wurde hierbei so kalibriert, dass für jede Dreieckseite 99% der Messwerte 
auf der Innenseite liegen. Die Abbildung 36 auf S.121 zeigt die Ergebnisse nach 
Geschlechtern getrennt. Diese geschlechtsspezifischen Extremdreiecke werden spä- 
ter für die automatisierte Kontrolle von Messung eingesetzt. Im Training bzw. 
auf HG1 wird noch kein Plausibilitätstest auf das Extremdreieck durchgeführt — 
entsprechend finden auch keine erzwungenen Rückfaltungen statt (vgl. Schritte 
6 und 9 in Abschnitt 3.7.4 auf S.105). Für HG1 ist das Extremdreieck und das 
Normtetragon somit rein informativ. Wohl aber werden die hier gewonnenen Wer- 
te für HG2, MSC und insbesondere in den in Kapitel 8 ab S.273 beschriebenen 
Tonaufnahmen der Dialekte zur automatischen Korrektur eingesetzt. 

Es ergeben sich die in Tabelle 9 auf S. 120 dokumentierten Eckpunkte des Ex- 
tremdreiecks. Man beachte, dass diese Werte keine erwarteten Werte für die be- 
zeichneten Vokale darstellen. Vielmehr handelt es sich um jene extremen Werte, 
von denen man annimmt, dass sie äußerst unwahrscheinlich jemals erreicht wer- 
den. Messwerte aus einer Test- oder Anwendungsmessung, die außerhalb des durch 
diese Eckpunkte aufgespannten Extremdreiecks liegen, werden tendenziell in die- 
ses zurückgefaltet (vgl. Schritt 9 auf S. 107). Insgesamt liegen 97% aller betonten 
Vokale aus HG1 im Inneren des Extremdreiecks. 
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Bark Hz 
HG1 Fi F2 Fi F2 
links oben i 25 +01 16,9 +0,6 250 +10 3.620 +60 
rechts oben u 26 +01 49 +02 260 +10 490 +20 
unten a 97 +05 115 +04 1200 +50 1.540 +40 


Frauen 

links oben i 254 +0,05 16,7 +0,2 254 +4 3.530 +20 
rechts oben u 2,90 +0,07” 52 +0,1 289 47 540 =10 
unten a 960 +0,20 11,3 +0,11 1.180 +10 1.520 +10 


Männer 

links oben i 2,47 +0,04 149 +01 247 +3 2590 +10 
rechts oben u 2,77 +0,06 54 +0,1 276 +5 560 +10 
unten a 840 +0,10 10,7 +0,1 990 +10 1.380 +10 


Tabelle 9: Statistik der Eckpunkte des 99%-Extremdreiecks über HG1, jeweils in 
Bark und rückkonvertiert in Hertz (Hz). Der Fehler ist mit Bootstrapping errech- 
net. Die geschlechtsspezifischen Extremdreiecke (unten) wurden unter der Nebenbe- 
dingung errechnet, ähnliche Winkel wie das über Gesamt-HGl ermittelte Dreieck 
aufzuweisen. Deswegen sind die Fehler vergleichsweise niedriger. Die geschlechtsspe- 
zifischen Extremdreiecke werden zur Rückfaltung benutzt. 


Bark Hz 
Fi F2 Fi F2 
2,7 +0,11 16,0 +0,4 270 +10 3.120 +40 
28 +01 58 +03 280 +10 610 +30 
78 +0,04 102 +0,22 894 +3 1.280 +10 
78 +0,05 12,0 +0,4 892 +4 1.680 +30 


links oben 
rechts oben 
rechts unten 
links unten 


vera 


Tabelle 10: Statistik der Eckpunkte des Normtetragons über HG1, welches auf dem 
Perzentilmittel des 95% bis 99 Bands basiert, jeweils in Bark und rückkonvertiert in 
Hertz (Hz). Der Fehler ist mit Bootstrapping errechnet. Der rechte untere Punkt 
sei hier zur Orientierung mit [a] bezeichnet (für jenen Kardinalvokal der höchsten 
Öffnungsstufe mit höchstem F1 und niedrigsten F2), obwohl das dem Hochdeutschen 
fremde [a] in HG1 natürlich nicht vorkommt. 
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Abbildung 36: Die betonten Monophthonge der HG1-Trainingsgruppe in der 
F1/F2-Ebene nach Geschlecht: links Frauen, rechts Männer. Eingezeichnet ist gestri- 
chelt das Normtetragon sowie das 99%-Extremdreieck über Gesamt-HG1 aus Abbil- 
dung 35. Das geschlechtsspezifische 99%-Extremdreieck ist mit durchgezogener Linie 
gezeichnet und wurde nur über das ausgewählte Geschlecht errechnet. Deutlich zu 
erkennen ist die kleinere Fläche des Extremdreiecks für Männer. 


Das Normtetragon ist ebenfalls in Abbildung 35 auf S. 119 gezeichnet. Es er- 
geben sich die Werte in Tabelle 10 auf S. 120. Diese Werte geben die erwarteten 
äußeren Begrenzungen für die Formanten an. Im Gegensatz zum Extremdreieck 
ist das Normtetragon zurzeit rein illustrativ und dient zur grafischen Verortung 
gegen die Normgesamtheit HG1. Dementsprechend ist es auch in den meisten der 
folgenden Grafiken eingezeichnet. 


4.2.5 Anmerkungen zur Robustheit 


An dieser Stelle sollen einige Anmerkungen zur Robustheit der Perzentilmaße ge- 
macht werden. Es soll exemplarisch die systematische Robustheit der F1- und 
F2-Perzentilmitten Qy, und Perzentilbreiten Qz aus Abschnitt 3.6.2, S.86f., im 
Vergleich zu den sonst üblichen Maßen Mittelwert und Standardabweichung ge- 
zeigt werden. Beide dieser Sätze von Maßzahlen machen Aussagen zur Lage des 
Formantzentrums und der Streubreite der Formanten. 

Systematische Robustheit für Fl und F2 bedeutet: Wenn einmal — unter Nut- 
zung aller prinzipiell zur Verfügung stehenden Trainingsdaten — der zentrale Ort 
und die Schwankungsbreiten der Hauptformanten eines Sprechers gefunden sind, 
so wünscht man sich von einem systematisch robusten Verfahren, dass genau die- 
se Werte auch mit eingeschränkten Daten ermittelt werden können. Insbesondere 
soll dies möglich sein, wenn die Testdaten systematisch von den Trainingsdaten 
abweichen, also z.B. hier unbetonte Vokale enthalten, dort aber nicht — oder die 
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empirischen Häufigkeiten einzelner Laute voneinander abweichen. Das wird kein 
Problem bei normierten Korpora sein — wohl aber, wenn Training und Test auf 
unterschiedlichen Korpora ablaufen. Diese Überlegung lässt sich von einem Spre- 
cher auf eine Vielheit von Sprechern übertragen. Und somit erhält sie Geltung 
für die Frage der Normalisierung aus Abschnitt 3.5, S.74f.: Normalisierung von 
F1 und F2 soll die physiognomische Sprechercharakteristik eliminieren — aber sie 
muss unabhängig vom Sprachkorpus sein. 

Zur Illustration wurde ein Experiment durchgeführt: Für jeden Sprecher von 
HG1 wurde das Maß für die Mitte und für die Streuung für Fl und F2 ermittelt. 
Einmal wurde ‚Mitte‘ mit dem klassischen Mittelwert und dann als Perzentilmitte 
gemessen. Das Gleiche wurde für ‚Streuung‘ durchgeführt, wobei einmal die klas- 
sische Standardabweichung und dann die Perzentilbreite angesetzt wurden. Die aus 
dem vollen Satz der originalen Daten ermittelten Werte wurden als Norm gesetzt. 
Dann wurde das Vokalsystem systematisch gestört, die Werte neu gemessen und 
zu den Normwerten ins Verhältnis gesetzt. Je robuster das Verfahren, desto näher 
an einem Verhältnis von 1 sollten die Messungen unter Störung bleiben. Der ei- 
gentliche Zahlenwert der Größen ‚Mitte‘ oder ‚Streuung‘ ist hier irrelevant: Es geht 
nur darum zu messen, welche Abweichung zum originalen Zahlenwert auftreten, 
wenn Störungen hinzukommen. Als Störung wurde zum einen das Vokalsystem 
verkleinert, also zufällig bestimmte Vokale gänzlich bei der Messung ausgelassen 
(von original 17 bis herunter auf 5, wobei die Eckvokale [il], [u] und [a] fixiert wur- 
den). Des Weiteren wurde die Häufigkeitsverteilung der Vokale schrittweise von 
99%-iger Übereinstimmung mit der originalen Verteilung hin zu einer künstlichen 
Gleichverteilung verändert (0%). 

Die sich ergebenden Mittelwerte der Verhältnisse aus 2.100 Simulationen pro 
Störung und Verfahren sind in Abbildung 37 auf S. 123 gezeichnet. Es zeigt sich 
das erwartete Muster: Unter der Annahme, dass extreme Eckvokale in der Messung 
vorhanden sind (was für die vorliegende Untersuchung in der Regel der Fall ist), 
kann Streuung und Mitte der F1/F2-Werte robust geschätzt werden. Das Verfah- 
ren ist robust gegenüber dem Fehlen anderer Vokale. Ebenso ist es robust gegen 
Änderungen der relativen Häufigkeiten der Vokale zueinander. Es ist also weniger 
sensitiv hinsichtlich der Unterschiede zwischen Trainings- und Testkorpora und 
eignet sich somit zum Normalisieren. 
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Abbildung 37: Verhältnisse zwischen gestörtem Wert und ungestörtem Wert der 
Maße ‚Mitte‘ und ‚Streuung‘ (y-Achse) bei zunehmender Störung. Auf der x-Achse 
ist die Zahl der in der Messung noch vorhandenen Vokale aufgeführt (beginnend von 
originalen 17; maximal gestört bis auf nur 5). Die Zeilenblöcke korrespondieren mit 
einem Übergang von einer fast originalen Häufigkeitsverteilung (0.99) bis hin zu einer 
erzwungenen künstlichen Gleichverteilung (0), was einer maximalen systematischen 
‚Störung‘ entspricht. Es zeigt sich, dass das robuste Verfahren des VOKALJÄGERS 
(volle Dreiecke) nah an dem gewünschten originalen Zielverhältnis von 1 (graue ho- 
rizontale Line) bleibt. Das klassische Verfahren (Kreise) weicht mit zunehmender 
Störung deutlich ab. 
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4.3 Hochdeutsche Formanten 


4.3.1 Verteilung in der F1/F2-Ebene 


Die Abbildungen 38 und 39 auf S. 125 bis 126 zeigen und erläutern die Verteilung 
der Formanten in der F1/F2-Ebene für die (meisten) Sprecherinnen und Sprecher 
der HG1-Gruppe. Das dort eingezeichnete Normtetragon wurde geschlechtsüber- 
greifend über HG1 ermittelt und stellt den Orientierungsrahmen dar (vgl. Tabelle 
10 auf S. 120). Die 99%-Extremdreiecke sind geschlechtsspezifisch. Ebenso einge- 
zeichnet ist mit einem Kasten der Wertebereich zwischen oberen und unterem 
Perzentilmitteln für den jeweiligen Sprecher. Die Messwerte sind auf der origina- 
len Skala in Bark bzw. Hertz also vor jeglicher Normalisierung und Rückprojektion 
notiert. Das Fehlen der Normalisierung ist deutlich in den unterschiedlichen Mus- 
tern zwischen männlichen und weiblichen Sprechern hinsichtlich des Normtetra- 
gons zu sehen: Die weiblichen Sprecherinnen neigen zu höheren Frequenzen, was 
eine Tendenz in den Diagrammen nach ‚unten links‘ bedingt. Umgekehrt ist es bei 
den männlichen Sprechern, die eine Tendenz nach ‚oben rechts‘ aufweisen. 

Abbildung 40 auf $. 127 zeigt und erläutert die Verteilung in der F1/F2-Ebene 
für HG2, die im Wesentlichen dem Muster aus HG1 folgt. Man beachte, dass das 
hier gezeichnete Normtetragon HGl entspricht. Ebenso sind die geschlechtsspezi- 
fischen Extremdreiecke auf HG1 errechnet worden. 

Abbildung 41 auf S.127 zeigt entsprechend die Muster für MSC. Die wesentli- 
che Erkenntnis ist das überaus extreme Verhalten der Kardinalvokale von Daniel 
Jones (als einzige Ausnahme außerhalb von HG1 wurden diese Daten auch nicht in 
das Extremdreieck rückgefaltet, um genau diese Extreme zu zeigen). Zur weiteren 
Diskussion vgl. Abschnitt 4.6.2 ab S. 154. 


4.3.2 Verteilung der F1- und F2-Perzentilmaße 


Abbildung 42 auf S. 129 zeigt die Verteilung der Perzentilmaße über HG1 auf: Un- 
teres Perzentilmittel Q, und oberes Perzentilmittel @, aus Abschnitt 3.6.2, S. 86 f. 
sowie Perzentilmitte Qy, und normierte Perzentilbreite Qg* aus Abschnitt 3.6.4, 
S.89f. Numerisch ergeben sich die in Tabelle 11 auf S. 128 dokumentierten numeri- 
schen Mittelwerte und Schwankungsbreiten, jeweils getrennt nach Geschlecht. Die 
Spalte p berichtet, wie signifikant die Abweichung der Mittelwerte im entsprechen- 
den Perzentilmaß zwischen weiblichen und männlichen Sprechern ist, wobei drei 
Sterne hier das höchste Signifikanzniveau anzeigen?®. Die über beide Geschlechter 
übergreifend ermittelten Größen (Spalte ‚w+m‘ in der Tabelle) sind die Werte, 
die für die Rückprojektion normalisierter Werte in den Frequenzskalenbereich zu 
Darstellungszwecken genutzt werden (vgl. Abschnitt 3.6.8 ab S.92). 


50Zum Signifikanzniveau siehe Abschnitt A.2.5 auf $. 440. 
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Abbildung 38: Weibliche Sprecher der Trainingsgruppe HG1 im F1/F2-Diagramm 
(F2: x-Achse und F1: y-Achse, jeweils in Bark und Hertz). Mit: Sprecher (z.B. K07); 
Satzkorpus (MR: Marburg, BE: Berlin); Geschlecht (F: weiblich); Altersgruppe (Y: 
jung; O: alt). Betonte Vokale sind mit einem Kreuz, unbetonte mit einem Kreis 
gezeichnet. Die gestrichelten Linien sind das Normtetragon und das weibliche 99%- 
Extremdreieck, die gepunktete Box umrahmt den Bereich innerhalb der Perzentilmit- 
tel der jeweiligen Sprecherin. Tendenziell, insbesondere im Vergleich mit den männ- 
lichen Sprechern aus Abbildung 39 auf S. 126, zeigt sich eine Ausrichtung nach links 
unten: Vokale weiblicher Sprecher sind heller bzw. zu hohen Frequenzen (F2: rechts; 
F1 oben) hin verschoben. Es wird aber auch ein großer Bereich abgedeckt und auch 
tiefe F2 (rechts) erreicht. 
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Abbildung 39: Auswahl männlicher Sprecher der Trainingsgruppe HG1 im F1/F2- 
Diagramm (F2: x-Achse; F1: y-Achse; jeweils in Bark und Hertz) mit: Sprecher (z.B. 
K07); Satzkorpus (MR: Marburg, BE: Berlin); Geschlecht (M: männlich); Alters- 
gruppe (Y: jung; O: alt). Betonte Vokale sind mit einem Kreuz, unbetonte mit einem 
Kreis gezeichnet. Die gestrichelten Linien sind das Normtetragon und das männ- 
liche 99%-Extremdreieck, die gepunktete Box umrahmt den Bereich innerhalb der 
Perzentilmittel des jeweiligen Sprechers. Tendenziell, insbesondere im Vergleich mit 
den weiblichen Sprechern aus Abbildung 38 auf S.125, zeigt sich eine Ausrichtung 
nach rechts oben: Vokale männlicher Sprecher sind dunkler bzw. zu tiefen Frequenzen 
(F2: rechts; Fl oben) hin verschoben. Es bleibt ein Freiraum zur linken Kante des 
Normtetragons: Höhere F2 (links) werden nicht erreicht. 
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Abbildung 40: Sprachproben der hochdeutschen Testgruppe HG2 im F1/F2- 
Diagramm mit: Sprecher (z.B. K61); Satzkorpus (MR: Marburg, BE: Berlin, KO: 
Kohler); Geschlecht (F: K62, weiblich, M: K61, männlich); Altersgruppe (O: alt). 
Betonte Vokale sind mit einem Kreuz, unbetonte mit einem Kreis gezeichnet. Die 
gestrichelten Linien sind das Normtetragon und das weibliche bzw. männliche 99%- 
Extremdreieck, die gepunktete Box umrahmt den Bereich innerhalb der Perzentil- 
mittel der jeweiligen Sprachprobe. Die Sprecherin K62 füllt das Normtetragon fast 
vollständig aus, während der männliche Sprecher K61 einen typischen linken Streifen 


freilässt. 
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Abbildung 41: Sprachproben der Testgruppe MSC im F1/F2-Diagramm. Die von 
Jones extrem gesprochenen Kardinalvokale liegen teilweise außerhalb des HG1-Norm- 


tetragons (gestrichelte Linie). 
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Abbildung 42: Boxplot-Statistik der Maße oberes und unteres Perzentilmittel (Q- 
oben und Q-unten), Perzentilmitte (Q-Mitte) und normierte Perzentilbreite (Q- 
Breite). Jeweils getrennt nach männlich und weiblich sowie nach F1 und F2. 


Orr Qu 
w-m w/m w-m w/m 
[Hz] [Hz] 


Fl 70% +%0 12 #02 80 +30 116 +0,08 
Fr 7% +0 11 +01 60 +30 1,06 +0,03 


Tabelle 12: Unterschiede zwischen weiblichen (w) und männlichen (m) Sprechern 
hinsichtlich der Perzentilbreite Qg* und Perzentilmitte Qu. Dargestellt ist die Dif- 
ferenz (w-m) und das Verhältnis (w/m) der Mittelwerte, jeweils ermittelt aus der 
weiblichen und männlichen Population in HG1. 
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Sowohl für Fl als auch F2 sind die unteren Perzentilmittel Q, eher gleich, aber 
die oberen Q, unterscheiden sich signifikant dahingehend, dass die der weiblichen 
Sprecher größere Werte annehmen. Damit ist der abgedeckte Wertebereich (bzw. 
die Perzentilbreite Qz) für Frauen größer als für Männer, wobei der Effekt nur für 
F2 mit einem Faktor von 1,2 +0,2 signifikant größer 1 ist. Ebenso erscheint die 
Perzentilmitte Qu für Frauen für Fl um +80 #30 Hz und für F2 um +60 +30 Hz 
nach oben verschoben. Es ergeben sich die in Tabelle 12 auf S. 129 dokumentierten 
Vergleichsmaße. Die Ergebnisse der Erhöhung der Perzentilmitte um +16% (Fl) 
und +6% (F2) liegen in etwa bei dem von Delattre (1965, 49) gemessenen Wert: 
„Ihe formants of a woman voice may be 10 to to 15 percent higher“. 


4.3.3 F1- und F2-Verteilungsdichten 


Die Abbildungen 43 auf S.131 und 44 auf S.132 zeigen die Verteilungen der Fl 
und F2 für ausgewählte Sprecher und Korpora aus HG1, HG2 und MSC. Die grau 
hinterlegten Formen sind mit R erzeugte Violin-Diagramme, die je breiter sind, 
desto häufiger Vokale mit entsprechenden Formantwerten in den Daten gemessen 
werden°!. In dunklem Grau dargestellt sind die Daten aus der Trainingsgruppe 
HG1 sowie, zum Vergleich (in Hellgrau), Daten aus den Testgruppen HG2 und 
MSC. Die Bilder zeigen jeweils getrennt weibliche und männliche Sprecher. Die 
Ausrichtung ist den üblichen Formantdiagrammen angeglichen: F1 wird vertikal 
von oben nach unten, F2 horizontal von rechts nach links, abgetragen. Eingezeich- 
net sind mit Symbolen das untere und obere Perzentilmittel nach den Formeln (21) 
und (22) von $.86 (Dreieck bzw. Quadrat) sowie der Mittelpunkt zwischen diesen 
beiden Werten nach Formel (25) von S.90. Die Linien entsprechen den Mitteln 
über diese Werte. 


4.3.4 Relativer Fehler der Perzentilmaße 


Abbildung 45 auf S.133 dokumentiert die Verteilung der relativen statistischen 
Fehler der Perzentilmaße über HG1: Unteres Perzentilmittel Q, und oberes Per- 
zentilmittel Q, aus Abschnitt 3.6.2, S. 86 f., sowie Perzentilmitte Qu und normier- 
te Perzentilbreite @g aus Abschnitt 3.6.7, S.91f. Die Schwankungsbreiten wurden 
mittels Bootstrapping geschätzt. Der mittlere relative Fehler über alle Größen be- 
trägt 3% +2% und im Einzelnen für Q, = 4% 42%, Q, = 1% +1%, Qu = 1.6% 
+0.6% und OB = 5% +2% (die +% sind hier Prozentpunkte!). Der relative Fehler 
ist für das untere F2-Perzentilmittel vergleichsweise hoch. Dies ist durch die ten- 
denziell dünnere Population von Formanten mit niedrigem F2 und niedrigem Fl 
bedingt. Grafisch korrespondiert dies mit einer vergleichsweise dünnen Abdeckung 
in der rechten oberen Ecke des Formanttetragons, wie es etwa in Abbildung 38 
von $.125 gut zu erkennen ist. Analog zeigt sich dies in dem schmalen, rechten 
Schwanz der Verteilung in Abbildung 44 auf S. 132. Die Ausdünnung ist bedingt 


5l17um Violin-Diagramm siehe Abschnitt A.2.3 auf $.439. 
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KO4BE 
K12MR 
K70MR 
K10MR 
K08MR 
K62KO 
K62MR 
K62BE 
K68MR 
K64BE 
KO6BE 
K02BE 


K61MR K61BE K65BE KO3BE K67MR K69MR KO5SBE K63BE K11MR KO1BE KO9MR K07MR K61KO DJCV 


Abbildung 43: Geschätzte Häufigkeitsverteilung der F1-Werte: Oben weibliche und 
unten männliche Sprecher aus HG1 (Durchgezogene Linie oben und unten: Mittel- 
werte des unteren und oberen Perzentilmittels; gestrichelte Linie: Mittelwert der 
Perzentilmitten nach Formel (25) von S.90). In Hellgrau gezeichnet — aber nicht in 
den Mittelwerten berücksichtigt — sind Daten aus den Testgruppen HG2 und MSC. 
Die Geschlechter unterscheiden sich nicht signifikant in ihrem unteren Perzentilmit- 
tel (oben), an dem die Graphen ausgerichtet sind. Das obere Perzentilmittel (untere 
Linie) hingegen ist für Frauen (Schaubild oben) signifikant höher. 
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Abbildung 44: Geschätze Häufigkeitsverteilung der F2-Werte: Links weibliche und 
rechts männliche Sprecher aus HG1 (Durchgezogene Linie links und rechts: Mit- 
telwerte des oberen und unteren Perzentilmittels; gestrichelte Linie: Mittelwert der 
Mittelpunkte nach Formel (25) von S.90). In Hellgrau gezeichnet — aber nicht in 
den Mittelwerten berücksichtigt — sind Daten aus den Testgruppen HG2 und MISC. 
Die Geschlechter unterscheiden sich nicht signifikant in ihrem unteren Perzentilmit- 
tel (rechts), an dem die Graphen ausgerichtet sind. Das obere Perzentilmittel (linke 
Linie) hingegen ist für Frauen (Schaubild links) signifikant höher. 
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Abbildung 45: Boxplot-Statistik der relativen statistischen Fehler der oberen und 
unteren Perzentilmittel (Q-oben: Q.; Q-unten: Q,) und der Perzentilbreite und - 
Mitte. Jeweils über HG1, bestimmt mit Bootstrapping, jeweils getrennt nach Fl und 
F2 sowie männlich und weiblich. Die gestrichelte Linie zeigt den totalen Mittelwert 
über alle relativen Fehler in HG1 an. Die Fehler sind für das untere F2-Perzentilmittel 
am größten, was durch die dünne Population in diesem Bereich bedingt ist. 


durch das HG1 zugrundeliegende Material, in dem z.B. [u]-Laute relativ weni- 
ger stark vertreten sind: Nach Tabelle 7 auf S.115 treten sie etwa halb so häufig 
auf wie entsprechende Vorderzungenvokale®?. Ebenso ist der Fehler allgemein für 
die Perzentilbreite hoch. Diese relative Fehler haben eine wichtige Bedeutung: Die 
Perzentilmaße gehen im Zuge der Sprechernormalisierung mehrmals in abgeleitete 
Größen und insbesondere den robusten Lobanov-Z-Wert ein (vgl. Formel (29) von 
S. 92). Es zeigt sich, dass die Fehler unkorreliert sind’®. Damit kann man den relati- 
ven Fehler der endgültigen akustischen Größe einfach abschätzen. In den robusten 
Lobanov-Z-Wert geht z.B. Qu und 05 ein. Der relative Fehler des Z-Werts ergibt 
sich somit zu etwa 5%. 


4.3.5 Statistik der Formanten 


Dieser Abschnitt dokumentiert mit dem VOKALJÄGER errechnete Statistiken auf 
den originalen F1, F2 und F3-Formantdaten vor Normalisierung. Abbildung 46 
auf S. 134 ist eine zusammenfassende grafische Darstellung der Statistik über HG1. 
Die Tabellen 13 und 14 auf den Seiten 135 f. dokumentieren die zugrundeliegenden 
Statistiken numerisch. 


52 Vergleiche auch Anmerkungen zur dieser Problematik und zur [u]-Häufigkeit im Hochdeut- 
schen auf S. 101. 

53Man misst eine Korrelation von —0,2 zwischen den absoluten Fehlern des unteren und oberen 
Perzentilmittels. Doch kann die Hypothese, dass die Korrelation Null ist, nicht verworfen werden 
(t = -0,7, p = 0,5). Zur Fehlerfortpflanzung siehe Abschnitt A.2.6 auf S.441. 
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Abbildung 46: Boxplot-Statistik von F1, F2 und F3 für alle Sprecher in HG1 
(oben) sowie jeweils für Frauen (Mitte) und Männer (unten). Die Daten sind nicht 
normalisiert und die Skala ist in Hertz. Jeweils: F3: obere graue Reihe; F2: mittlere 


Reihe; F1: untere Reihe. 
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4.4 Normalisierte hochdeutsche Formanten 


4.4.1 Wirkung der Normalisierung 


Das Ziel der Normalisierung ist das Eliminieren einer Verzerrung der Messwer- 
te, die nur durch die Physiognomie und insbesondere das Geschlecht gegeben 
ist (vgl. Abschnitt 3.5 ab S.74). In Abschnitt 4.3.2, S.124f., wurden die deut- 
lichen geschlechtsspezifischen Unterschiede der Perzentilmaße als Kenngrößen ge- 
zeigt und das Muster wiederholt sich in den Einzelstatistiken aus Abschnitt 4.3.5, 
S.133f. Dieser Abschnitt bezeugt die Wirksamkeit der im VOKALJÄGER angesetz- 
ten Normalisierungsverfahren, insbesondere der robusten Lobanov-Normalisierung 
aus Abschnitt 3.6.7, S. 91£. 

Die Abbildungen 47 bis 49 auf S. 138-140 veranschaulichen und erläutern die 
Auswirkung der Normalisierung anhand ausgewählter Vokale: Vor der Normalisie- 
rung sind die Formanten über einen weiten Bereich gestreut (gezeichnet sind in 
den jeweils oberen Bildern die Interquartilellipsen, also der Bereich, in dem, bei 
Annahme von Symmetrie der Verteilung, 50% der Messwerte zu erwarten sind). 
Der Formantbereich eines einzelnen Lauts und Sprechers ist wenig deckungsgleich 
mit den Formantbereichen desselben Lauts, geäußert von anderen Sprechern (und 
vor allem des anderen Geschlechts). Wohl aber überlappt der Formantbereich ei- 
nes ausgewählten Lauts und Sprechers mit anderen Lauten der übrigen Sprecher. 
Beide Effekte sind unerwünscht, erlauben sie doch aufgrund des ‚Verschmierens‘ 
der Formantbereiche keine saubere Trennung der phonemischen Laute anhand der 
phonetischen Formantbereiche. Genau das ist aber zur gewünschten Klassifikation 
mit dem VOKALJÄGER nötig. 

Die hier angewendete robuste Normalisierung nach Lobanov beseitigt die un- 
erwünschten Artefakte. Das ist exemplarisch in den jeweils unteren Bildern gut zu 
erkennen, die die normalisierten Werte zeigen. Man beachte, dass hier die Darstel- 
lung nicht in ihrer originären Z-Werte-Skala erfolgt, sondern eine Rückprojekti- 
on auf den Frequenzskalenbereich eines hypothetischen androgynen Sprechers des 
Hochdeutschen durchgeführt wurde (vgl. Abschnitt 3.6.8, S. 92£.). Im Ergebnis ist 
nach Normalisierung die Deckung gleicher Laute sprecherübergreifend erhöht und 
die Überlappung verschiedener Laute reduziert. 
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Abbildung 47: Wirkung der Normalisierung auf die Vokale [ir/u:/a:] (grau) und 
[1/0] (weiß) für alle Sprecher in HG1. Dargestellt sind originale Messungen (oben) und 
robust lobanovnormalisierte Werte nach Rückprojektion (unten). Die Ellipsen appro- 
ximieren die Interquartilbereiche unter Berücksichtigung der Korrelation von F1 und 
F2. Deutlich zu erkennen ist, wie sich normalisierte Vokale in der F1/F2-Ebene an 
bestimmten Punkten konzentrieren und Überlappungen wunschgemäß stark zurück- 
gehen. 
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Abbildung 48: Wirkung der Normalisierung auf die Vokale [er/o:/a] (grau) und 
[e/>] (weiß) für alle Sprecher in HG1. Dargestellt sind originale Messungen (oben) 
und robust lobanovnormalisierte Werte nach Rückprojektion (unten). Die Ellipsen 
approximieren die Interquartilbereiche unter Berücksichtigung der Korrelation von 
F1 und F2. Deutlich zu erkennen ist, wie sich normalisierte Vokale in der F1/F2- 
Ebene an bestimmten Punkten konzentrieren und Überlappungen wunschgemäß 
stark zurückgehen. 
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Abbildung 49: Endgültige Wirkung der robusten Lobanov-Normalisierung auf 
HG1. Dargestellt sind die Verteilungen in der F1/F2-Ebene pro Laut über alle Spre- 
cher (original: oben; normalisiert und rückprojiziert: unten). Die Ellipsen approxi- 
mieren den Interquartilbereich und die Lautmarkierung das Zentrum (Median). Zur 
Unterscheidung sind Langvokale grau eingefärbt und Reduktionsvokale mit einer ge- 
strichelten Linie versehen. Zu erkennen ist ein Schrumpfen der Ellipsen als auch eine 
höhere Trennung derselben voneinander. 
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4.4.2 Erhöhung der Überlappung durch Normalisierung 


Der endgültige Test zur Wirksamkeit der Normalisierung ist ein Test auf erhöhte 
Trennschärfe in der Klassifikation. Dieser wird dann im Zuge der Klassifikations- 
tests in Abschnitt 6, S. 215£., durchgeführt. 

Zur empirischen Beurteilung der Leistungsfähigkeit der Normalisierungen kann 
allerdings schon hier ein Experiment vorgestellt werden: Es wurde gemessen, ob 
sich durch Normalisierung die je nach Sprecher verschiedenen Verortungen eines 
Lauts in der F1/F2-Ebene über alle Sprecher angleichen. Es wurden die drei ver- 
schiedenen Normalisierungsverfahren aus den Abschnitten 3.6.5, 3.6.6 und 3.6.7 
von S. 90 f. angesetzt, die robuste Varianten der Gerstman-, MAD- und Lobanov- 
Verfahren sind. Als Testmaß dazu bietet sich hier der Überlappungskoeffizient 
zweier Verteilungen an (vgl. Abschnitt A.2.7 ab S. 441). 

Die Problemstellung ist in Abbildung 50 auf S. 142 exemplifiziert und erläutert: 
Nach Normalisierung überlappen die Verteilungen gleicher Laute stärker und sind 
im Idealfall identisch (in vorliegenden Testdaten und Experiment sind die Lautver- 
teilungen aufgrund des genormten Sprachkorpus, der HG1 unterliegt, grundsätzlich 
sprecherübergreifend ähnlich und liegen ‚nur‘ in unterschiedlichen Bereichen der 
F1/F2-Ebene). Abbildung 52 auf S. 144 stellt und erläutert die Verbesserung des 
Überlappens durch die robuste Lobanov-Methode dar. Für 77% der Sprecherpaare 
ergibt sich eine Erhöhung des Überlappungskoeffizienten bei Fl im Median um 
+0,18 und F2 um +0,15. 

Abbildung 51 auf S.143 zeigt die Abhängigkeit der Verbesserung der Über- 
lappungskoeffizienten von der gewählten Normalisierungsmethode: Die Methoden 
nach Gerstman und Lobanov unterscheiden sich wenig, was ihrem ähnlichen For- 
melaufbau in der robusten Variante geschuldet ist. Die Methode nach MAD erreicht 
manchmal deutlich bessere, aber auch schlechtere Ergebnisse. Anzumerken ist hier 
auch, dass die MAD-Methode, gegenüber der robusten Lobanov oder Gerstman 
Methode, anfälliger für Störungen im Zentralbereich der Verteilung ist, wie sie 
für unterschiedliche Sprachkorpora bei den Formanten auftreten. Für Größen, die 
keine Formanten sind, ist das weniger ein Problem. 

Im Mittel über alles, wie in Tabelle 15 auf S. 143 gezeigt, erscheinen die Unter- 
schiede wenig relevant. Die Methode der robusten Lobanov-Normalisierung wurde 
als Standard für den VOKALJÄGER ausgewählt. 


4.4.3 Statistik normalisierter Formanten 


Dieser kurze Abschnitt dokumentiert auf den Seiten 144-146 die Ergebnisse der 
Normalisierung der Formanten auf HG1 mittels des robusten Verfahrens nach Lo- 
banov. Ergänzende Statistiken zu den Z-Werten und der MAD-Normalisierung 
sind weitgehend ähnlich und erscheinen ab Abbildung 122 auf S. 456 im Anhang. 
Diskussion und weitere Darstellungen folgen dann in Abschnitt 4.6 ab S. 150. 
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[1] [i] [1] und [i:] 
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Abbildung 50: Veranschaulichung der Normalisierung: Dargestellt sind die F1-Häu- 
figkeitsverteilungen für [1] (jeweils durchgezogene Linie) und [ir] (jeweils gestrichelte 
Linie) für eine Sprecherin (K12MR: schwarz) und einen Sprecher (KO3BE: grau). 
Die x-Achse entspricht Bark-Einheiten. Die obere Reihe zeigt die Situation vor der 
Normalisierung: Sowohl für [1] (links) also auch [ir] (mittig) sind die Verteilungs- 
dichten derart gegeneinander verschoben, dass die Höcker des weiblichen Sprechers 
(schwarz) zu höheren Bark-Werten nach rechts versetzt sind. Das [1] des männlichen 
Sprechers (durchgezogene Linie, grau) überlappt im Kombinationsbild rechts außen 
deutlich mit dem [ir] des weiblichen Sprechers (gestrichelte Linie, schwarz), was sich 
durch die Verschiebung nach tieferen Frequenzen für Männer erklärt. Die untere Rei- 
he zeigt die Situation nach robuster Lobanov-Normalisierung im VOKALJÄGER und 
Rückprojektion nach Bark: Die [1] (durchgezogene Linie) und [ir] (gestrichelte Linie) 
liegen jeweils übereinander und es gibt keine (geschlechtsspezifischen) Unterschei- 
dungsmerkmale mehr. Damit geht einher, dass die Situation der Überlappung von 
weiblichen [1] und männlichen [ir] beseitigt ist. 
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Fi F2 
Methode P25 P50 P75 P25 P50 P75 
Lobanov 0,01 0,13 030 -0,01 01 02 
Gerstman 0,01 0,13 0,30 -0,01 0,1 02 


MAD 0,00 0,12 0,27 0,00 01 02 
Tabelle 15: Statistik der Verbesserung der Überlappungskoeffizienten nach Nor- 
malisierungsmethode. 
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Abbildung 51: Verbesserung der Überlappung zwischen den Häufigkeitsverteilun- 
gen eines bestimmten Lauts (x-Achse) beim Übergang von originalen zu normalisier- 
ten Daten, jeweils für Fl und F2. Gezeigt ist der Median der Verbesserung, abhängig 
von der robusten Normalisierungsmethode: Lobanov (Q), Gerstman (G) und MAD 
(M). Die Methoden nach Gerstman und Lobanov sind weitgehend identisch. MAD 
zeigt positive als auch negative Abweichungen. 
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Verbesserung Überlapp 


 leEEa:aO0oUuy:Y2:9@6 i: leEE:aaO0o: Uuy:Y2:9@6 


Abbildung 52: Boxplot-Statistik der Verbesserung der Überlappung zwischen den 
Häufigkeitsverteilungen eines bestimmten Lauts (x-Achse) beim Übergang von ori- 
ginalen zu robust lobanovnormalisierten Daten, jeweils für Fl und F2. Gemessen 
wurde die Überlappung zwischen den Verteilungen zweier Sprecher, wobei alle mög- 
lichen Sprecherpaar-Kombinationen aus HG1 angesetzt wurden. Es zeigt sich eine 
Erhöhung der Überlappung durch Normalisierung. 
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Abbildung 53: Boxplot-Statistik der Formanten F1 (unten), F2 (Mitte) und F3 
(oben) nach robuster Lobanov-Normalisierung und Rückprojektion, jeweils über alle 
Sprecher. Die Formantfrequenzskala ist in Hertz (Hz). 
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4.5 Lautdauer und Intensität 


original (ms) | normalisiert (Z) | rückprojiziert (ms) 
P25 P50 P75 |P25 P50 P75 | P25 P50 P75 


| 60 80 10 | 01 0960 80 10 

ı| 50 600 701-8 -05 00| 50 60 70 
e:| 0 100 10|o00 09 16| so 100 130 
e| om so 90|-2 01 05| 70 80 90 
&| so 100 ı50|03 07 16| so 100 130 
al oo Ss 100102 02 07| 0 80 100 
a«|ı0 10 w|ıı 18 26|10 10 1m 
> 0 0 901904 01 0383| © m 90 
o: | 100 120 150|08 14 21|ı0 10 150 
v| 50 6 8s0o|-,7 -3 00| 50 6 80 
w| 60 80 120|-03 03 ı2| oo 90 1% 
v:| © 10 0|00 06 13| 70 100 1% 
| 50 6 70|-0,8 -05 -02| 49 56 67 
»| so 110 140|03 10 18| 90 110 140 
@| 0 so 1mo|l-3 01 05| 0 8 90 
| 0 50 70|-10 07 0903| 0 50 70 
®e 


60 8 1101-03 02 0,9 60 80 110 


Tabelle 18: Quartile für die Lautdauer für alle Sprecher in HG1. P25: 25%-Perzentil; 
P50: Median; P75: 75%-Perzentil. Im Interquartilband zwischen P25 und P75 liegt 
die Hälfte der Messwerte. Die Anzahl der dargestellten signifikanten Stellen ergibt 
sich aus der statistischen Unsicherheit, die hier auf die Hälfte des Interquartilbands 
gesetzt wurde (fix eine Nachkommastelle). Es ist zu erkennen, dass die Normalisie- 
rung hier wenig Effekt hat. 
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original (dB) | normalisiert (Z) | rückprojiziert (dB) 

P25 P50 P75  P25 P50 P75 | P25 P50 P75 

ir 1 a 76|-06 00 05| 72 74 76 
1 2 5 7|-6 01 07| 72 74 IT 
el 2 5 7|\-4 02 07| 3 7 17 
€ 72. 8. 97,0. 0810| 2 © 77 
| 2 5 76|-06 -01 05| 72 74 76 
alInı A 7-09 00 07| 71 74 LT. 
am. 22. 7- 18-\0,5: 0,820 1. 
h) 73 7% 78|-01 04 10] 74 76 78 
o| 3 7% 7|/-0,3 04 11) 3 76 78 
vl na 6 7|-02 04 09] 73 76 78 
ur be 75 
yı 2 7a 7|-06 00 06| 72 74 76 
yı nn 5 7|-05 03 08] 2 75 77 
»| A = 79|1|01 097 12| Aa 7 79 
el 6 8 79|1|02 07 13| 5 7 79 
9 69 73 7|-12 -0A 03) 70 73 75 
e| 69 7A MT7\|\-11 -01 05| 70 74 76 


Tabelle 19: Quartile für die Intensität für alle Sprecher in HG1. P25: 25%-Perzentil; 
P50: Median; P75: 75%-Perzentil. Im Interquartilband zwischen P25 und P75 liegt 
die Hälfte der Messwerte. Die Anzahl der dargestellten signifikanten Stellen ergibt 
sich aus der statistischen Unsicherheit, die hier auf die Hälfte des Interquartilbands 
gesetzt wurde (maximal eine Nachkommastelle). Es ist zu erkennen, dass die Nor- 
malisierung wenig Effekt hat. 
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Abbildung 54: Boxplot-Statistik der Lautdauer nach robuster MAD- 
Normalisierung und Rückprojektion, jeweils über alle Sprecher. Die y-Skala 
ist in ms. Erwartungsgemäß ist die Lautdauer langer Vokale (dunkel) höher als die 
kurzer Vokale. 
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Abbildung 55: Boxplot-Statistik der Intensität nach robuster MAD-Normalisierung 
und Rückprojektion, jeweils über alle Sprecher. Die Skala ist in dB. Erwartungsgemäß 
ist die Intensität der Reduktionsvokale (dunkel) niedriger als die der betonten Vokale. 
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4.6 Diskussion 


4.6.1 Messphonetische Formantmuster des Hochdeutschen 


Die Formantmuster, die sich aus der Analyse der hochdeutschen Testmenge HG1 
des Kiel-Korpus mit dem VOKALJÄGER ergeben, werden auf den folgenden Seiten 
dokumentiert. Die Abbildungen 56 bis 58, S. 151-153, diskutieren die Formant- 
muster der hochdeutschen Ausprägungen der primären und sekundären Kardi- 
nalvokale in der F1/F2- und F2/F3-Ebene. Angewendet wurde jeweils die robus- 
te Lobanov-Normalisierung und die Messwerte sind geschlechtsübergreifend nach 
Rückprojektion dargestellt. Gezeichnet sind zur Verdeutlichung ebenfalls die Inter- 
quartilellipsen, also die Bereiche, in denen die Hälfte der Messwerte zu vermuten 
ist. Die Zentren der Ellipsen entsprechen den in Tabelle 17 auf S. 146 dokumen- 
tierten Werten®“. 

Im Wesentlichen zeigen sich in der Messung mit dem VOKALJÄGER die für das 
Hochdeutsche erwarteten Muster, genauso wie sie auch in der Literatur beschrieben 
sind (vgl. Abschnitt 4.6.4 ab S. 159). Ein Laut allerdings fällt auf, das lange [ur]. Es 
erscheint vergleichsweise zentralisiert, also im Diagramm mit erhöhten F2-Werten 
gegenüber [o:] leicht nach links verschoben (alternativ hätte man aber auch ei- 
ne unerwartet starke Rückwärts- oder Rechtsverschiebung des [o:] diagnostizieren 
können). Die Verschiebung der [u:] bzw. [o:] könnte durchaus ein valides Artikula- 
tionsmuster der Sprecher des Kiel-Korpus sein. Auch Pätzold/Simpson (1997, 13) 
messen im Kiel-Korpus tendenziell dieselbe Zentralisierung des [u:] (vgl. Abschnitt 
4.6.4.4 auf S. 162). Sie führen als eine mögliche Erklärung die Konsonantenkonstel- 
lationen an: „The |...] reason for difference could reside in the consonantal contexts 
of /u:/ and /o:/ in the lexical items in both sets of sentences, favouring back rea- 
lizations of /o/ and front realizations of /u:/“. Damit wäre die Zentralisierung ein 
Korpusartefakt. Auch liegt eine messtechnische Herausforderung vor: Der zweite 
Formant in [u:] ist schwer zu erfassen. F2 in [u:] korrespondiert mit einem nur 
leicht ausgeprägten Buckel im Amplitudenspektrum, wie man in Abbildung 8 auf 
S.43 schön erkennen kann°®. Daraus ergibt sich eine erhöhte Unsicherheit im Ver- 
gleich zu den Vokalen, die deutlich spitzere Maxima haben. Aufschluss können nur 
Folgeuntersuchungen liefern (vgl. Abschnitt 6.2 ab S.229 zu den Auswirkungen 
der [u:]-Zentralisierung in der Klassifikation). 


54Dje Interquartilellipsen sind eine Approximation, da sie von einer symmetrischen Verteilung 
ausgehen. Setzt man die Hälfte des Interquartilbands aus Tabelle 17 pro Laut und Formant als 
Maß für die Streuung an, ergeben sich folgende Quartile P25, P50 und P75 der Streuung: Für 
F1 misst man 7,2%, 8,2% und 9,0% sowie für F2 6,1%, 7,3% und 9,2%, jeweils über alle Laute. 
Damit liegt die Schwankungsbreite für 75% der Laute gut unter 10%. 

55Für die [u:)-Laute im Englischen ist die Situation völlig gleich: In der Darstellung in Deller 
u.a. (1992, 123) ist der Buckel so schwach, dass er gar nicht mehr zu erkennen ist. 
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Abbildung 56: Mit dem VOKALJÄGER gemessene Formantmuster des 
Hochdeutschen (in der F1/F2-Ebene). Dargestellt sind errechnete Interquartil- 
ellipsen über die hochdeutsche Testmenge HG1 des Kiel-Korpus, robust lobanovnor- 
malisiert und rückprojiziert. Die hochdeutschen Ausprägungen der primären Kardi- 
nalvokale [ir/er/e/a:/>/o:/u:] sind dunkel gezeichnet, die der sekundären Kardinal- 
vokale [y:/o:/ce] sind hellgrau eingefärbt. [1/v/v/a] sind im Hintergrund gezeichnet. 
[e:/o/e] sind hier nicht eingetragen. Die Muster entsprechen vollständig den Erwar- 
tungen. Es zeigt sich, dass das Kiel-Korpus ein scheinbar leicht zentralisiertes [u:] 
aufweist, ein Muster, welches auch so von Pätzold/Simpson (1997) gemessen wurde 
(vgl. Abschnitt 4.6.4.4, $.162£.). 
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Abbildung 57: Einzelaspekte hochdeutscher Formantmuster in der F1/F2-Ebene. 
Dargestellt sind mit dem VOKALJÄGER errechnete Interquartilellipsen über die hoch- 
deutsche Testmenge HG1 des Kiel-Korpus, robust lobanovnormalisiert und rückpro- 
jiziert. Links oben: Die Vokale [ir/a:/u:] besetzen die Ecken des Formantdreiecks. 
Einzig [u:] erscheint gegenüber [o:] tendenziell zentralisiert. Rechts oben: Die kurzen 
[1/v/v] sinken von der Stufe ihrer langen Partner [ir/y:/u:] auf die Stufe der [e:/o:/o:] 
ab. Links unten: Das [e:] des Kiel-Korpus erscheint zwischen [e:] und [e:] mit starker 
Neigung hin zu [er]. Rechts unten: Die Reduktionsvokale [o/®] erscheinen zentral und 
in der F1/F2-Ebene überlagert mit [o:/ce]. 
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Abbildung 58: Einzelaspekte hochdeutscher Formantmuster in der F2/F3-Ebene. 
Dargestellt sind mit dem VOKALJÄGER errechnete Interquartilellipsen über die hoch- 
deutsche Testmenge HG1 des Kiel-Korpus, robust lobanovnormalisiert und rückpro- 
jiziert. Man beachte, dass auch die F3-Skala invertiert ist. Links oben: Die runden 
sekundären Kardinalvokale hochdeutscher Ausprägung [y:/a:/oe] erscheinen tenden- 
ziell mit einem niedrigerem F3. Bei den runden primären Kardinalvokalen [u:/o:/>] 
in der Realisierung des Kiel-Korpus fällt nur [ur] auf. Rechts oben: Die Redukti- 
onsvokale [o/e] erscheinen gegenüber den Rundvokalen [er/ce], mit denen sie in der 
F1/F2-Ebene zusammenfallen, mit einem höheren F3. Links unten: [o:] und [v] fallen 
in der F2/F3-Ebene zusammen (ebenso wie in der F1/F2-Ebene). Rechts unten: Die 
kurzen [v/v] unterscheiden sich wenig von ihren langen Partnern [u:/y:] hinsichtlich 
F3. Deutlich hingegen ist der Unterschied in [1/ir]. 
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Abbildung 59: Boxplot-Statistik von nicht-normalisierten F1, F2 und F3 für die 
Kardinalvokale, gesprochen von Daniel Jones. Die Skala ist in Hertz. Jeweils F3 in 
der oberen grauen Reihe, F2 in der mittleren und F1 in der unteren Reihe. 


4.6.2 Vergleich mit den Kardinalvokalen 


Interessant ist der Abgleich mit den Kardinalvokalen in der Aufnahme von Daniel 
Jones (vgl. Abschnitt 4.1.3 ab S.113 zu der Aufnahme). Abbildung 59 auf S. 154 
und Tabelle 20 auf S. 156 zeigen die Statistik für die Kardinalvokale vor Norma- 
lisierung. Abbildung 60 auf S.155 setzt die Kardinalvokale nach Normalisierung 
und Rückprojektion mit dem hochdeutschen Korpus HG1 in Bezug. Für die Voka- 
le [i/e/e] und [oe] liegt im Wesentlichen Übereinstimmung vor. Für [u/o] gilt dies 
ebenso, doch erscheinen die Varianten von Daniel Jones tendenziell weiter hinten 
zu liegen. Auch findet sich das [>] von Jones weiter hinten als das hochdeutsche 
[>]. Dies deckt sich mit entsprechender Verortung im IPA-Diagramm, so etwa in 
Kohler (1999, 87). 

Gänzlich unterschiedlich sind [y/o]. Die Varianten von Daniel Jones erscheinen 
wesentlich weiter vorne als die hochdeutschen. Dies bestätigt sich durch Abhören: 
Daniel Jones’ Aussprache ähnelt dem der hochdeutschen [y/o] wenig. Zu einem 
ähnlichen Schluss kommt Vaissiere (2011, 54) in einem Vergleich zum Französi- 
schen: „DJ’s [y] does not sound as [y] (similar remark for DJ’s [e])“. 

Abbildung 61 auf S. 155 zeigt das komplementäre Bild. Hier werden jene Kardi- 
nalvokale dargestellt, die dem Hochdeutschen systematisch fehlen. Interessant ist 
der extrem vordere, offene und runde Kunstvokal [«@]. Er befindet sich hier in der 
Flucht der deutschen vorderen und runden Vokale [y/o/oe] (die in dem Bild die 
mittlere Ellipsenreihe von oben nach unten bilden. Die A-Laute [a/a/n] werden in 
Abschnitt 4.6.3 ab S. 157 gesondert beschrieben. 
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Abbildung 60: Vergleich des VOKALJÄGERs mit den Kardinalvokalen von Daniel 
Jones (hier: DJ) in lobanovnormalisierter und rückprojizierter Darstellung. Die Ellip- 
sen approximieren die Interquartilbereiche nach dem VOKALJÄGER (eingeschränkt 
auf die Laute, für die auch Proben in DJ vorliegen). Die Lautbezeichnungen zeigen 
die Medianwerte nach DJ. Bei voller Übereinstimmung sollten diese in den Mittel- 
punkten der Ellipsen liegen. Insbesondere für [y/o] (dunkelgrau, oben links), [a] und 
[>] (hellgrau, Mitte rechts) liegen deutliche Abweichungen vor. 
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Abbildung 61: Darstellung der Kardinalvokale aus der Aufnahme von Daniel Jones, 
die keine Äquivalente im Hochdeutschen aufweisen. 
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Abbildung 62: Der [a]-Laut (hellgrau) und [a:]-Laut (dunkelgrau) des Hochdeut- 
schen in lobanovnormalisierter und rückprojizierter Darstellung (Interquartilellip- 
sen). Zum Vergleich die A-Laute der höchsten Öffnungsstufe [a/a/p] nach Daniel 
Jones (Mediane). 


4.6.3 Das messphonetische A 


Abbildung 62 auf S. 157 zeigt die beiden A-Laute [a/a:] des Hochdeutschen bzw. 
des VOKALJÄGERS im Vergleich mit den A-Lauten [a/a/n] nach Daniel Jones. 
Zuerst fällt auf, dass sich [a] und [a:] im VOKALJÄGER wenig unterscheiden. Das 
bestätigt den Sieb’schen Normativ der qualitativen Äquivalenz des kurzen [a] und 
des langen [a:] in hochdeutscher Bühnenaussprache (vgl. Abschnitt 2.3.2 ab S. 31). 
Doch hat im Vergleich [a] (Bild: hellgrau) eine tendenziell vordere Lage und [a:] 
(Bild: dunkelgrau) eine tendenziell hintere Lage. Das deckt sich mit der in Russ 
(1994, 125) gemachten Anmerkung: „The short vowel in Ratte is pronounced with 
the tongue slightly more advanced than the long vowel in raten“. 

Das [a] von Daniel Jones erscheint allerdings deutlich weiter vorne bzw. weniger 
zentral als die hochdeutschen [a/a:]. Das Daniel-Jones-[a] liegt in der Verlängerung 
der vorderen Vokale [i/e/e] und bestätigt so seine extreme vordere Ausprägung. Die 
hochdeutschen [a/a:] sind signifikant zentraler als die Extremvarianten von Daniel 
Jones, die wesentlich weiter vorne (al) bzw. weiter hinten ([a/n]) liegen. Somit 
bekräftigt diese Messung das Ansetzen der hochdeutschen [a/a:] als Zentralvokale. 
Man beachte auch, dass die extrem offenen Hintervokale [a] (gespreizt) und [n] 
(rund) weit hinter den hochdeutschen [a/a:] und [5] liegen. 

An dieser Stelle wird die Frage aus Abschnitt 2.3.2, S. 31f., wieder aufgegriffen, 


56Vorab sei angemerkt, dass das [a] nach Daniel Jones natürlich der IPA-[a] Variante entspricht 
und nicht mit dem dunklen A des Frankfurterischen deckungsgleich ist. Dieses dunkle A wird 
in dieser Arbeit, phonetisch-phonologisch motiviert, ebenso mit dem Lautzeichen [a] bezeichnet 
(vgl. Abschnitt 9.4.1.1 ab $. 307). 
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ob denn nun das hochdeutsche Vokalsystem ein Dreieck- oder Tetragonsystem ist? 
Phonemisch ist die Antwort eindeutig: Dreieck. Aus messphonetischer Sicht gibt 
es zwei Antworten. Wenn man auf die Ergebnisse über die gesamte HG1-Gruppe 
vor Normalisierung schaut, wie z.B. in Abbildung 35 von $.119, zeigt sich eine 
leichte Tetragonstruktur (die untere Spitze des Extremdreiecks ist ausgedünnt). 
Diese Struktur ist maßgeblich durch den Unterschied zwischen männlichen und 
weiblichen Sprechern erklärt: Aus Tabelle 13 von S.135 liest man für [a] einen 
weiblichen F2-Median von 1.460 Hz und einen männlichen von 1.300 Hz ab sowie 
1.380 Hz vs. 1.210Hz für [a:]). Über beide Laute hinweg ergibt sich aus Tabelle 
14 von S.136 ein Schwankungsbereich von ca. 270Hz ([a:] P25 1.200 Hz bis [a] 
P75 1.470Hz). Da aber der VOKALJÄGER ‚blind‘ auf Daten vor Normalisierung 
aufsetzt, ist aus rein statistischer Überlegung hier die Annahme eines Tetragons 
sinnvoll. Dies gilt insbesondere für die Berechnung des Normtetragons, was hier 
als Visualisierungshilfe angesetzt wird (vgl. Abschnitt 3.6.9, S.93f.)?”. 

Wenn man auf die Daten nach Normalisierung schaut, ändert sich das Bild: 
Wie aus Tabelle 16 auf S.145 zu entnehmen ist, reduziert sich der Unterschied 
der F2-Mediane nach Normalisierung und Rückprojektion zwischen der weiblichen 
und der männlichen Gruppe auf nur ca. 20 Hz (dieser Wert ist darüber hinaus nicht 
signifikant — das spricht für den Erfolg der Normalisierung im VOKALJÄGER, die 
ja gerade zum Ziel hat, geschlechtsspezifische Unterschiede herauszurechnen). Es 
verbleibt nach Tabelle 17 von S. 146 über alle Sprecher in HG1 ein F2-Interquar- 
tilbereich für [a] von P25 mit 1.270Hz bis P75 mit 1.470 Hz ([a:]: P25 mit 1.190 
bis P75 mit 1.380 Hz). Diese Schwankungsbreite von etwa 150 Hz, die nach Nor- 
malisierung verbleibt, ist den allophonischen Variationen zuzurechnen. 

Somit kann man das hochdeutsche Vokalsystem als schwach messphonetisch 
viereckig bezeichnen, wobei die Ausprägung vor Normalisierung stärker ist als die 
danach. 


57Man beachte auch, dass für die Berechnung des die Rückfaltung steuernden Prüfwerts ß, 
Formel (32) von S.98, das konservativere Extremdreieck angesetzt wird, und somit die Frage 
nach der Tetragonform eher nachrangig ist. 
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4.6.4 Abgleich mit hochdeutschen Vergleichsmessungen 


In diesem Abschnitt wird ein kurzer Abgleich mit ausgewählten experimentalpho- 
netischen Untersuchungen der Vokale des Hochdeutschen durchgeführt. Der Schwer- 
punkt wird auf jene Untersuchungen gelegt, die explizit Formanten veröffentlichen 
(in der Regel Mittelwerte in Hertz). 


Um eine Vergleichbarkeit dieser Messungen untereinander sowie mit dem VO- 
KALJÄGER, zu erreichen müssen die Daten normalisiert und rückprojiziert werden 
(im Normalfall mit der robusten Lobanov-Methode). Das ist natürlich ein Pro- 
blem, wenn die Originaldaten im Detail nicht verfügbar sind und nur Ergebnisse 
wie der Mittelwert publiziert wurden. Denn die robuste Normalisierung des VO- 
KALJÄGERS setzt auf den Rändern der Verteilung auf, die hier nicht bekannt sind. 


Ein Trick, dies zu umgehen, ist die Methode des resamplings. Es wird eine 
künstliche Population von Messwerten erzeugt, die die in der Publikation vorgege- 
benen Mediane oder Mittelwerte pro Laut als Kennzahl haben. Als Träger dieser 
Information wird hier ein (willkürlich gezogener) Sprecher aus HG1 angesetzt, 
dessen Daten entsprechend umskaliert werden. Damit erhält man einen Pseudo- 
Carrier-Sprecher, dessen gemittelte Ergebnisse pro Laut der Publikation entspre- 
chen und dessen Schwankungsmuster um diese Werte pro Laut vom VOKALJÄGER 
übertragen wurden. Dieser Sprecher kann nun mit dem Standardverfahren des VO- 
KALJÄGERS prozessiert werden (nur Normalisierung). 


Im Ergebnis wird de facto die Messung aus der Publikation an den Ecken des 
durch [ir], [a] und [u:] aufgespannten Dreiecks ‚aufgezogen‘ und ausgerichtet. Die 
Verhältnisse innerhalb des Vokalvierecks sind die der Originalpublikation. 


Man findet über alle Publikationen hinweg im Wesentlichen, wie erwartet, eine 
Übereinstimmung mit dem VOKALJÄGER. Die Übereinstimmung ist bei neueren 
(digitalen Groß-Korpora) Messungen, wie z.B. bei Pätzold/Simpson (1997) und 
Sendlmeier/Seebode (2006) höher als bei älteren analogen Einzelsprecher-Messun- 
gen, wie z.B. bei Delattre (1965), Rausch (1972) und Ramers (1988), was auch an 
der Genauigkeit des Messverfahrens liegen mag. Die Grundgesamtheit der alten 
Messungen ist darüber hinaus wesentlich kleiner (manchmal eben nur einen oder 
wenige Sprecher enthaltend), was deren statistische Aussagekraft einschränkt. Es 
ist wichtig, die Variationen zwischen den verschiedenen Publikationen anzuerken- 
nen, die ja alle für sich (mehr oder weniger und indirekt) in Anspruch nehmen, das 
Hochdeutsche zu beschreiben. Es erscheint unangebracht, die eine oder andere — 
oder den VOKALJÄGER - als richtig(er) zu erklären. Genauso ist es problematisch, 
nur auf abgeleitete Größen wie Mittelwerte zu setzen. 


Die Ergebnisse sind alle vom selben Darstellungstyp: Die Interquartilellipsen 
des VOKALJÄGERS sind im Hintergrund gezeichnet und die Mediane der Publika- 
tion darüber gelegt. Man beachte, dass alle Darstellungen rückprojiziert sind, also 
z.B. die Hertzwerte nicht der Originalpublikation entsprechen. Die Darstellung 
erfolgt nach Publikationsjahr. 
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Abbildung 63: Vergleich des VOKALJÄGERs mit Ergebnissen aus Delattre (1965) 
(hier: DE) in lobanovnormalisierter und rückprojizierter Darstellung. Die Ellipsen 
approximieren die Interquartilbereiche nach dem VOKALJÄGER. Die Lautbezeich- 
nungen zeigen die Medianwerte nach DE. Bei voller Übereinstimmung sollten diese 
in den Mittelpunkten der Ellipsen liegen. Als Erstes fällt die exakte vertikale Aus- 
richtung der Vokale pro Stufe auf einer Linie auf. Dies ist vermutlich ein Artefakt 
des Experimentdesigns in DE, das genau dies so konstruiert. Bis auf [u] und [>], die 
mehr geschlossen und hinten erscheinen, fallen die Werte mit denen des VOKALJÄ- 
GERS zusammen. 


4.6.4.1 Delattre 


Formantstatistiken über Fl und F2 für die Sprachen Englisch, Französisch, Spa- 
nisch und Deutsch finden sich bei Delattre (1965, 49). Es handelt sich hier um 
prototypische Formanten eines männlichen Sprechers, die durch Synthese erzeugt 
wurden. Bei einem Experiment wurden künstliche Vokale so lange in Fl und F2 
variiert und von Muttersprachlern abgehört, „until found typical“ (Delattre 1965, 
53). Das Experimentdesign scheint Delattre u.a. (1952, 198) zu folgen, das erst 
einen Formanten variierte (z.B. F1), dann diesen fixierte und dann den anderen 
(z.B. F2) für verschiedene Vokale variierte und dann ebenfalls fixierte. Folglich 
sind die streng horizontal ausgerichteten F1-Werte eher die Folge des Experiment- 
Designs als frei gemessene Frequenzen. Die Ergebnisse sind in Abbildung 63 auf 
S. 160 zu finden und erläutert. 


4.6.4.2 Rausch 


Formanten für hochdeutsche Sprecher finden sich in Rausch (1972). Die hier ge- 
nutzten Daten (für den männlichen Sprecher II) wurden aus Kohler (1995, 50) 
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Abbildung 64: Vergleich des VOKALJÄGERs mit Ergebnissen aus Rausch (1972) 
(hier: RA) in lobanovnormalisierter und rückprojizierter Darstellung. Die Ellipsen 
approximieren die Interquartilbereiche nach dem VOKALJÄGER. Die Lautbezeich- 
nungen zeigen die Medianwerte nach RA. Bei voller Übereinstimmung sollten diese 
in den Mittelpunkten der Ellipsen liegen. Bei RA fällt vor allem ein tieferliegendes 
[#:] und [v] auf. 
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Abbildung 65: Vergleich des VOKALJÄGERSs mit Ergebnissen aus Ramers (1988) 
(hier: RM; Sprecher H links, Sprecher P rechts) in lobanovnormalisierter und rück- 
projizierter Darstellung. Die Ellipsen approximieren die Interquartilbereiche nach 
dem VOKALJÄGER. Die Lautbezeichnungen zeigen die Werte der beiden Sprecher 
aus RM an. Bei voller Übereinstimmung sollten diese in den Mittelpunkten der EI- 
lipsen liegen. [oe] liegt im erwarteten horizontalen Verbund [e/ce/>5], allerdings mit 
Schwankungen. [u:] und [1] schwanken ebenso. Man beachte die deutliche offenere 
Realisierung von [e:] in RM, das hier mit [e] zusammenfällt. Damit unterscheidet 
sich RM von der deutlich geschlosseneren Artikulation des Kiel-Korpus, wo [e:] und 
[er] zusammenfallen. 


abgelesen. Der Vergleich zum VOKALJÄGER findet sich in Abbildung 64 auf S. 161. 


4.6.4.3 Ramers 


Vokalstatistiken für Fl, F2 und F3 (im Kontext [b_ton]) sowie für die Lautdauer 
publiziert Ramers (1988, 159-216). Es sprachen vier in etwa gleich alte männliche 
hochdeutsche Sprecher 80 Einzelwörter und 20 Sätze ein. Die Formanten wurden 
mit einem Sonographen durch Ablesen an einem geeigneten Zeitpunkt bestimmt: 
„[...| unter Berücksichtigung der Mitte der jeweiligen Formantbänder und der Gip- 
felposition des entsprechenden Querschnitts“. Weitere Stellwerte waren: Fenster- 
länge: 25,6 ms; 10kHz Abtastrate (Ramers 1988, 170f.). Abbildung 65 auf S.162 
zeigt und erläutert die Ergebnisse dieser Vergleichsmessung. 


4.6.4.4 Pätzold und Simpson 


Wichtig ist, aufgrund der direkten Vergleichbarkeit, die Untersuchung des Kiel- 
Korpus — und zwar der Marburger und Berliner Sätze - in Pätzold/Simpson (1997). 
Dort findet sich eine Untersuchung der Vokalformanten F1, F2 und F3 unter Anga- 
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Abbildung 66: Vergleich des VOKALJÄGERs mit Ergebnissen aus Pätzold/Simpson 
(1997) (hier: PS) in lobanovnormalisierter und rückprojizierter Darstellung, links für 
weibliche, rechts für männliche Sprecher. Die Ellipsen approximieren die Interquar- 
tilbereiche nach dem VOKALJÄGER. Die Lautbezeichnungen zeigen die Medianwerte 
nach PS. Bei voller Übereinstimmung sollten diese in den Mittelpunkten der Ellip- 
sen liegen. Im Wesentlichen ist eine Übereinstimmung in der Form zu sehen und die 
Mediane der Vergleichsmessung liegen innerhalb der Interquartilbereiche des Vo- 
KALJÄGERS. Eine Ausnahme ist [oe], das in PS systematisch aus dem eigentlich 
zu erwartenden horizontalen Verbund [e/a/>] ausbricht. Es sei vermerkt, dass PS 
und der VOKALJÄGER beide das Kiel-Korpus untersuchen und genau dieselbe leicht 
zentralisierte Stellung des [u:] messen (vgl. hierzu das auf Seite 150 Gesagte). Die ro- 
buste Lobanov-Normalisierung erzielt den zu erwartenden deutlichen Zusammenfall 
der Geschlechter, so dass kaum Unterschiede zwischen der Darstellung der weiblichen 
und männlichen Sprecher zu vermerken sind. 
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Abbildung 67: Vergleich des VOKALJÄGERS mit Ergebnissen aus Sendlmeier//See- 
bode (2006) (hier: SS) in lobanovnormalisierter und rückprojizierter Darstellung, 
links für weibliche, rechts für männliche Sprecher. Die Ellipsen approximieren die 
Interquartilbereiche nach dem VOKALJÄGER. Die Lautbezeichnungen zeigen die Me- 
dianwerte nach SS. Bei voller Übereinstimmung sollten diese in den Mittelpunkten 
der Ellipsen liegen. Alle Vokale liegen im Bereich des VOKALJÄGERS. Die robus- 
te Lobanov-Normalisierung erzielt den zu erwartenden deutlichen Zusammenfall der 
Geschlechter, so dass kaum Unterschiede zwischen der Darstellung der weiblichen 
und männlichen Sprecher zu vermerken sind. 


be der Quartile. Die Analyse erfolgte dort digital mittels LPC (Fensterlänge 20 ms; 
5 ms Fensterversatz; LPC-Ordnung 14 für Männer und 16 für Frauen; Extraktion 
am -Punkt). In Abbildung 66 auf S.163 sind die Ergebnisse, nach Geschlecht 
getrennt, nebeneinander gestellt. 


4.6.4.5 Sendlmeier und Seebode 


Bei Sendlmeier/Seebode (2006) findet sich eine Fl- und F2-Formantstatistik, die 
an der TU Berlin errechnet wurde. Zugrunde liegen Vokalrealisierungen von 127 
Sprechern, die von 1998 bis 2006 aufgenommen wurden (hochdeutsche Standard- 
lautung ohne dialektale Einfärbung; Zweisilber mit betontem langen oder kurzem 
Vokal sowie einem Schwa). Die Auswertung erfolgte mit PRAAT. Die Ergebnisse 
finden sich, nach Geschlecht getrennt, in Abbildung 67 auf S. 164. 
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4.6.5 Schluss 


In diesem Kapitel wurde die Funktionsfähigkeit des VOKALJÄGERS gezeigt: Auf ei- 
ner repräsentativen Datenmenge für das Hochdeutsche, die zehntausend Vokalpro- 
ben umfasst, konnte vollautomatisch und ohne händische Nachkorrektur eine Sta- 
tistik gemessen werden, die die wesentlichen messphonetischen Muster des hoch- 
deutschen Vokalsystems aufzeigt. Diese Muster liegen im Bereich des Erwarteten 
und stimmen mit denen von anderen Publikationen überein. 
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Kapitel 5 


Algorithmische Klassitikationsphonetik 


Zusammenfassung: Die für den VOKALJÄGER entwickelte klassifikationspho- 
netische Algorithmik ist die zweite Säule der vorliegenden Arbeit. Es wird 
das neue Konzept des gleitenden phonetischen Merkmals eingeführt. Dies er- 
möglicht es, den Erwartungswert eines phonetischen Merkmals, wie z.B. der 
Öffnungsstufe der Hinterzungenvokale, zu errechnen: Es ergibt sich der zen- 
trale Merkmalswert Zeta C (Abschnitt 5.1 ab S.170). Mit den Merkmalswer- 
ten können nun Merkmalsdifferenzen zwischen Lautgruppen, den sogenannten 
Kontrastgruppen, bestimmt werden. Die Analyse der Differenz hinsichtlich ih- 
rer Signifikanz erlaubt Schlüsse über das Vorliegen bestimmter Dialektmuster. 
Eine typische Frage wäre z.B.: Unterscheidet sich das Dehnungs-A qualita- 
tiv vom neutralen A? Das wäre ein Muster des Frankfurter Stadtdialekts 
(Abschnitt 5.2 ab S.182). Technisch werden die Merkmalswerte bzw. die zu- 
grundeliegenden Merkmalswahrscheinlichkeiten mit dem Instrumentarium des 
Machine-Learnings bestimmt. Dabei kommen moderne Verfahren wie die Sup- 
port-Vector-Machine (SVM) oder die Mixture-Discriminant-Analysis (MDA) 
zum Einsatz (Abschnitt 5.3 ab S. 192). Dazu müssen die Algorithmen bzw. die 
sogenannten Binärklassifikatoren auf ausgewählte Binärmerkmale des Hoch- 
deutschen ‚trainiert‘ werden (Abschnitt 5.4 ab S. 206). 
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5.1 Das phonetische Merkmal als statistische Größe 


5.1.1 Konzept 


Die klassische Klassifikationsphonetik ist die Lehre vom abstrakten Lautmuster 
und vom Merkmal (vgl. Abschnitt 2.1 ab S. 16). Klassifikationsphonetische Merk- 
male sind in diesem Konzept diskrete und ordinale Größen. Zum einen weisen 
sie nur diskrete sich einander gegenseitig ausschließende Merkmalsausprägungen 
auf, welche hier als Elementarausprägungen bezeichnet werden sollen. Zum ande- 
ren sind die Elementarausprägungen ordinal, was bedeutet, dass man sie in eine 
bestimmte Reihung bringen kann. Im Ergebnis ist die Sprache quantal: In ihren 
Merkmalsausprägungen wechselt sie innerhalb eines Ensembles in wohldefinierten, 
einheitlichen Schritten®. Ein Beispiel ist das Merkmal der Öffnungsstufe, das für 
das Hochdeutsche die diskreten Elementarausprägungen ‚offen‘, ‚halboffen‘, ‚halb- 
geschlossen‘ und ‚geschlossen‘ annehmen kann und zwar in genau dieser ordinalen 
Reihung. Zwischenstufen wie ‚etwas offener‘ sind zulässig und werden mit Diakri- 
tika bezeichnet. Den Elementarausprägungen können äquivalente diskrete nume- 
rische Werte zugewiesen werden, welche die ordinale Reihung repräsentieren. Für 
das Merkmal der Öffnungsstufe wären dies die Zahlenwerte 4, 3, 2 und 1, die zu- 
sammen das Ensemble bilden. Doch schon für die Diakritika-Zwischenstufen stellt 
sich die Frage nach dem zuzuweisenden numerischen Wert. In der Marburger Dia- 
lektologie werden hierfür z.B. Schrittwerte von 1% angesetzt, womit sich für das 
Beispiel der Öffnungsstufe die Reihe der numerischen Elementarausprägungen 4, 
41%, 3, 3% usw. ergibt (Herrgen u.a. 2001, 3). 

Doch sind diese Schrittwerte ausreichend? Feste Schritte der Größe 1% sind 
faktisch immer noch diskret bzw. quantal. Warum nicht noch feinere Abstufungen 
wählen”? Mit der Methode der Messphonetik in Kombination mit dem machine lear- 
ning eröffnet sich die Möglichkeit, diese automatisch und numerisch zu bestimmen. 
Für den VOKALJÄGER werden die streng diskreten klassischen Merkmalsgrößen 
erweitert und folgender Ansatz gewählt (vgl. dazu Schaubild 68 auf S. 172). Dazu 
wird ein wahrscheinlichkeitsgewichteter Merkmalswert eingeführt: 


Es wird angenommen, dass, abhängig von einem messphonetischen 
Lautsignal, die diskreten klassifikationsphonetischen Elementarausprä- 
gungen eines Merkmals mit bestimmten Wahrscheinlichkeiten vorliegen 
bzw. unterschiedlich wahrscheinlich sind. Der zentrale Wert des gleiten- 
den phonetischen Merkmals ( (Zeta) sei definiert als der Erwartungs- 
wert der diskreten Elementarausprägungen. ( ist eine kontinuierliche 


58Der Begriff quantal bezieht sich hier nicht auf die quantal nature of speech nach Stevens 
(1989), die ja artikulatorisch motiviert ist. Hier ist damit die ‚Quantisierung‘ der Schritte zwischen 
den Elementarausprägungen in Anlehnung an die Quantenphysik gemeint. 
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und nicht mehr diskrete Größe — sie gleitet zwischen den fixen Werten 
der Elementarausprägungen. 


Die Wahrscheinlichkeit für das Auftreten einer einzelnen Elementarausprägung sei 
bestimmt durch den Wahrscheinlichkeitswert des zugeordneten sogenannten pho- 
netischen Binärmerkmals. Dieser misst die Wahrscheinlichkeit für das Auftreten 
einer einzelnen Elementarausprägung in hypothetisch vollständiger Isolation von 
allen anderen Elementarausprägungen des zu untersuchenden Merkmals. Stützlau- 
te seien die Laute, die für eine gegebene Elementarausprägung repräsentativ sind. 
Kontrastlaute seien solche, die als Gegenpol genau diese Elementarausprägungen 
nicht aufweisen. 

Mit diesem Ansatz ist die klassifikationsphonetische Merkmalsbestimmung für 
den VOKALJÄGER in die Statistik übertragen worden. Die Ausprägung eines Merk- 
mals in einer unbekannten Lautprobe wird aus der statistischen Ähnlichkeit mit 
bekannten Lautproben, den Stützlauten, die eine bekannte Merkmalsausprägung 
aufweisen, ermittelt. Damit geht einher, dass die Ermittlung nicht mehr unab- 
hängig ist. Sie ist vollständig abhängig von den Stützlauten, auf die sie trainiert 
wird. 

Abschnitt 5.1.2 ab S.171 definiert das gleitende Merkmal vollständig; Binär- 
merkmal, Stütz- und Kontrastlaute werden in Abschnitt 5.1.3 ab S.176 weiter 
ausgeführt und die Nutzanwendung, statistische Merkmalsdistanzen zu errechnen, 
folgt in Abschnitt 5.1.4 ab S. 178. Dort wird gezeigt, wie Merkmalsdistanzen zur 
Messung von Dialektalität genutzt werden können. Die für den VOKALJÄGER 
ausgewählten Merkmale und die verwendeten mathematischen Modelle aus dem 
Machine-Learning sind in Abschnitt 5.3 ab S. 192 dokumentiert. Die Ergebnisse 
für das Hochdeutsche legt Kapitel 6, S. 215f., dar - für das Frankfurterische sind 
sie in die phonetisch-phonologischen Lautbeschreibungen in Kapitel 9 ab S. 283 
eingebunden. 


5.1.2 Ensemble und gleitender phonetischer Merkmalswert 


Der gleitende Merkmalswert wird auf dem Ensemble der Elementarausprägun- 
gen bzw. der Binärmerkmale errechnet. Mathematisch sei der Wert des gleitenden 
Merkmals einer Lautprobe - der initiale Merkmalswert — als der Erwartungswert 


ab Mi Pilz) (35) 


definiert, was dem wahrscheinlichkeitsgewichteten Mittel der Elementarausprägun- 
gen entspricht (x ist ein Datensatz akustischer Größen, wie z.B. den Formanten, 
der das Lautsignal abbildet; m; ist der der Elementarausprägung i zugeordnete dis- 
krete numerische Merkmalswert; N ist die Anzahl der Elementarausprägungen und 
somit die Ensemblegröße; p;(x) ist der Wahrscheinlichkeitswert des Binärmerkmals 
i, also die Wahrscheinlichkeit, dass die Elementarausprägung i vorliegt). Somit ist 
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(Beispiel: Öffnungsstufe „halboffen“) (Beispiel: Rundungsgrad „rund“) 


Abbildung 68: Konzeptschaubild zur Erörterung des gleitenden Merkmals am Bei- 
spiel (links: I) der Öffnungsstufe der Hinterzungenvokale und (rechts: II) dem Run- 
dungsgrad der Vorderzungenvokale (vereinfacht). Die oberen Bilder zeigen, wie in ei- 
nem Ensemble Binärmerkmale den Elementarausprägungen zugeordnet werden und 
auf welchen Stützlauten sie aufsetzen. Links: Zur Elementarausprägung ‚3‘ des Merk- 
mals der Öffnungsstufe, also ‚halboffen‘, gehört z.B. das Binärmerkmal ‚3 oder Nicht- 
3° (mathematisch: 3 | 3) und der Stützlaut [>]. Rechts: Zur Elementarausprägung 
‚2‘ des Merkmals des Rundungsgrads der Vorderzungenvokale, also ‚rund‘, gehört 
z.B. das Binärmerkmal ‚2 oder Nicht-2‘ (mathematisch: 2 | —2) und die Stützlaute 
[y:/e:/oe]. Während die Stützlaute die Laute sind, welche die gewünschte Elemen- 
tarausprägung aufweisen, sind die Kontrastlaute Repräsentanten der Laute, welche 
die besagte Elementarausprägung gerade nicht besitzen (vgl. die unteren Bilder). Den 
Binärmerkmalen sind Wahrscheinlichkeitsfunktionen zugeordnet, die bestimmen, wie 
wahrscheinlich die dem Binärmerkmal zugeordnete Elementarausprägung ist. Diese 
Wahrscheinlichkeit wird später von einem Machine-Learning-Binärklassifikator er- 
rechnet werden. Alle Binärmerkmale zusammen bilden das Ensemble. Mittelt man 
im Ensemble die Elementarausprägungen wahrscheinlichkeitsgewichtet, ergibt sich 
für einen unbekannten Laut der Wert C des gleitenden Merkmals. 
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C° das gewünschte wahrscheinlichkeitsgewichtete Merkmalsmaß. C° wird pro Laut- 
probe ermittelt. Aus dem initialen Wert C° wird in einem nachgelagerten Schritt 
der endgültige und eigentliche Mittelpunktswert ( errechnet (vgl. Abschnitt 5.2.1 
ab $.182)5°. 

Rein technisch ist die Anzahl N der Elementarausprägungen frei wählbar. Das 
Gleiche gilt für die Zahlenwerte m; der Elementarausprägungen. Auch müssen sie 
nicht streng den üblich verwendeten Werten folgen und können nach Bedarf ge- 
wählt werden. Damit Formel (35), S.171, Sinn macht, müssen die numerischen 
Zahlenwerte m; der Elementarausprägungen eine Repräsentation der ordinalen 
Reihung sein. Für z.B. die Öffnungsstufe der Hinterzungenvokale sind dies hier 
die numerischen Werte m; = 4,3, 2,1, die den Stützlauten [a:/>/o:/u:] entsprechen. 
Auch sollten die m; so gewählt werden, dass sich im Ergebnis phonetisch-phonolo- 
gische Schlüsse ableiten lassen, etwa so, dass am Ende ein dem Marburger D-Wert 
äquivalentes Konstrukt entsteht. 

Die quantale Struktur der Sprache muss durchscheinen: Nur signifikante und 
deutliche Abweichungen von einer klassischen Elementarausprägung sollen gezählt 
werden. Auch müssen die Wahrscheinlichkeitsfunktionen technisch zueinander kom- 
patibel sein, so dass sie als miteinander vergleichbare Gewichte p;(x) in Formel (35) 
eingehen können. Um diese Anforderungen zu erfüllen, werden die p;(x) in einem 
speziellen Prozess kalibriert, der in Abschnitt 5.4.6 ab S. 210 erläutert wird. Ab- 
bildung 69 auf S.174 zeigt ein Beispiel für C. 

Aus dem kontinuierlichen Ansatz ergeben sich unmittelbar Vorteile: So ist es 
sehr einfach möglich, statistische Tests durchzuführen, insbesondere ob sich zwei 
Lautgruppen signifikant hinsichtlich eines Merkmals unterscheiden und es kann ei- 
ne statistische Merkmalsdistanz errechnet werden (vgl. Abschnitt 5.1.4 ab S. 178). 
Sonst durch Diakritika markierte Variationen sind nun Zwischenwerte, die, je nach 
Ähnlichkeit, numerisch näher an der einen oder der anderen Elementarausprä- 
gung liegen. Das ‚Zusammenbauen‘ des gleitenden phonetischen Merkmals aus 
den einfachen Binärmerkmalen als kompakte Basisbausteine erlaubt den direkten 
und einfachen Einsatz von Machine-Learning-Algorithmik. Dort wird dann jedem 
Binärmerkmal ein mathematischer Binärklassifikator zugeordnet. Dieses ‚Baukas- 
tenprinzip‘ des VOKALJÄGERS ist sehr flexibel und kann an beliebige Laut- bzw. 
Dialektmuster angepasst werden. Es werden vornehmlich jene Variationen unter- 
sucht, die, gegeben den Dialekt, erwartet bzw. nicht erwartet sind und bestimmt, 
wie signifikant diese sind (vgl. Abschnitt 5.1.4 ab S. 178 zur Merkmalsdistanz und 
Signifikanz). 

Ein Problem des gleitenden Merkmals ist, dass mess- und damit klassifikati- 
onsphonetische Variationen jeglicher Art mit beliebiger und möglicherweise über- 
genauer Feinheit erfasst werden. Auch der Marburger D-Wert steht vor einer ähn- 
lichen Herausforderung und Herrgen u.a. (2001, 2) merken dazu an: „Um potenzi- 
elle Verzerrungen des Dialektalitätswertes zu vermeiden, ist es darüber hinaus bei 


59 Anhang A.4.1 ab $.449 ergänzt weitere mathematische Anmerkungen, die über die Ausfüh- 
rungen in diesem Abschnitt hinausgehen. 
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Abbildung 69: Das rechte Bild zeigt exemplarisch einen gleitenden phonetischen 
Merkmalswert ( (fallende Kurve). Ergänzt ist eine stufige diskrete Form, die an- 
zeigt, welches Binärmerkmal gerade die höchste Wahrscheinlichkeit hat. Der Merk- 
malswert C wurde errechnet für Lautproben, die aus dem dunkelgrauen Band in der 
F1/F2-Ebene auf dem linken Bild entnommen wurden. Der gleitende Merkmalswert 
C korrespondiert hier mit der Öffnungsstufe der Hinterzungenvokale, nimmt konti- 
nuierliche Werte zwischen den Elementarausprägungen mı = 4 für [a:] und mı =1 
für [u] an und ist auf der y-Achse des rechten Bilds abgetragen. Die x-Achse ist 
hier mit rückprojiziertem F1 als Repräsentant des zweidimensionalen Lautsignals 
x = (F\, Fa) gewählt. Die vertikalen Bänder im rechten Bild markieren den erwarte- 
ten Bereich, in denen die Elementarausprägungen 4, 3, 2,1 bzw. die Laute [a:/>/o:/u:] 
am wahrscheinlichsten sind. Zwei wesentliche Dinge sind für ( zu beobachten: Zum 
einen bilden sich deutliche Plateaus an den Zahlenwerten der Elementarausprägun- 
gen heraus. Lautproben auf diesen Plateaus werden als ‚ideale‘ Repräsentanten der 
Stützlaute erkannt — hier scheint die quantale Struktur der Sprache hinsichtlich der 
Elementarausprägungen durch. Das zweite Muster ist das deutliche Herausbilden 
eines Übergangsbereichs zwischen den Plateaus — diese Lautproben erscheinen als 
Zwischenwerte, die numerisch zwischen den diskreten Elementarausprägungen lie- 
gen. Dies sind Laute, die man klassisch in enger Notation mit einem Diakritikum 
markiert. Die genaue Form der Kurve ergibt sich aus der Kalibrierung der Wahr- 
scheinlichkeiten p;. 
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der Messung freier Rede notwendig, dialektale und regionalsprachliche Realisatio- 
nen von standardsprachlichen realisationsphonetischen Reduktionsphänomenen zu 
unterscheiden, die typisch für die spontan artikulierte und nicht bewusst kontrol- 
lierte Standardsprache sind. Solche Phänomene gehen nicht in die Messung ein“. 
Eine entsprechende Korrektur durch einen Experten muss gegebenenfalls auch in 
der Analyse des gleitenden Merkmals erwogen werden — und zwar nicht nur für 
Reduktionsphänomene, sondern für alle nicht dialektal bedingten realisationspho- 
netischen Besonderheiten. In vorliegender Arbeit mit dem VOKALJÄGER wird auf 
jeglichen manuellen Eingriff bewusst verzichtet, da eine weitgehend automatisiert- 
objektive Verarbeitung angestrebt wird. 

Der gleitende Merkmalswert stellt eine deutliche Abkehr zu dem klassischen 
phonetischen Merkmal mit seinen diskreten Elementarausprägungen dar. Aber ge- 
nau dieser Bruch ist notwendig, um dialektale Lautmuster klar gegen das Hoch- 
deutsche -— und untereinander — auf einer auf das Hochdeutsche geeichten Skala 
vergleichen zu können. 


Bei der Errechnung des gleitenden phonetischen Merkmals ( findet der 
Übergang von einer beliebigen messphonetischen Größe x zu einem auf 
das Hochdeutsche genormten Skalar statt, der eine klassifikationspho- 
netische Bedeutung hat. Diese Transformation isoliert und fokussiert 
auf genau das eine Merkmal, welches klassifikationsphonetisch unter- 
sucht werden soll, und erlaubt lineare Abstandsmessungen. 


Nur, wenn die Übergänge zwischen den auf das Hochdeutsche normierten Stütz- 
stellen des gleitenden Merkmals, den klassisch-diskreten Elementarausprägungen, 
kontinuierlich sind, lassen sich die Varietäten der Dialekte in feiner Genauigkeit 
erfassen. Sonst besteht die Gefahr, dass eine wesentliche Varietät an eine der Ele- 
mentarausprägungen zwangsangeglichen wird und so nicht mehr erkannt werden 
kann. Abbildung 70 auf S. 176 zeigt Beispiele für das Hochdeutsche. 

Mathematisch gesehen ist der gleitende Merkmalswert auch eine Transforma- 
tion aus dem höherdimensionalen Zahlenraum, in dem die akustischen Größen de- 
finiert sind, in das Eindimensionale. Damit ergibt sich eine weitere Interpretation 
bzw. Bedeutung des gleitenden Merkmalswerts: Er stellt eine generalisierte skalare 
Form der akustischen Größen dar, die auf das Wesentliche reduziert werden. An 
die Stelle z.B. des zweidimensionalen Zahlenraums der ersten beiden Formanten, 
wie in der linken Abbildung 69 auf S. 174, tritt der eindimensional-skalare gleiten- 
de Merkmalswert (, was der y-Achse im rechten Schaubild entspricht. Wichtig ist, 
dass die Transformation den Bezug zur originalen physikalischen Bedeutung der 
messphonetischen Größen auflöst. Es ist gleich, ob die originale Größe die Formant- 
frequenzen F1, F2 und gegebenenfalls F3, Lautdauer, Intensität usw. oder auch eine 
Kombination solch unterschiedlicher Maße darstellt: Nach Transformation beliebi- 
ger höherdimensionaler Ausgansgrößen entsteht mit dem gleitenden Merkmal eine 
normierte, einheitliche phonetische Skala, auf der entsprechende Abstände errech- 
net werden können (vgl. Abschnitt 5.1.4 ab S. 178). 
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K61MR K62KO 


2-80 
<L ER ü 
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a a: 16] 


Abbildung 70: Exemplarische Statistik des gleitenden Merkmals der Öffnungsstufe 
der Hinterzungenvokale für zwei hochdeutsche Sprecher der Testmenge HG2 und für 
die Laute [a/a:/>/o:]. Eingezeichnet sind die einzelnen Messwerte C° sowie, als Vio- 
lindiagramme, die Schätzungen ihrer Verteilungsdichten. Die dunklen Rauten sind 
die Mediane bzw. die Merkmalswerte (. [a:/a/o:] liegen in dem für das Hochdeutsche 
erwarteten Bereich von ( = 4 bzw. € = 2. [5] liegt in der Probe von K61MR mit 
GC < 3 unter dem hochdeutschen Erwartungswert, ist aber immer noch deutlich unter- 
schiedlich sowohl zu [a/a:] als auch zu [o:]. Sprecher K62KO liegt auf dem Zielwert 
von(a=3. 


5.1.3 Phonetisches Binärmerkmal, Stütz- und Kontrastlaute 


Das Binärmerkmaldes VOKALJÄGERS ist ein verallgemeinertes phonetisches Merk- 
mal, welches nur die binären Ausprägungen ‚wahr‘ und ‚falsch‘ kennt. Es zeigt im 
VOKALJÄGER an, ob eine bestimmte Elementarausprägung eines Merkmals in 
einer Lautprobe vorliegt oder nicht. Das Binärmerkmal des VOKALJÄGERS ist all- 
gemeiner, technischer und weniger formell als die klassischen Binärmerkmale, etwa 
aus Chomsky/Halle (1991). 

Die Wahrscheinlichkeitsfunktion p;(x) ist der klassifikationsphonetische Basis- 
baustein des gleitenden Merkmalswerts aus Formel (35) von $. 171. Sie nimmt den 
Wert 1 an, falls, gegeben ein Satz messphonetischer Größen x, das Binärmerkmal 
i bzw. die entsprechende Elementarausprägung sicher vorliegt. Entsprechend ist 
das Ergebnis 0, falls das Binärmerkmal sicher nicht vorliegt. Sonst liegt p; zwi- 
schen 1 und 0. Das Binärmerkmal orientiert sich an den sogenannten Stützlauten, 
die die Menge der Laute sind, die für ein Merkmal repräsentativ die gewünschte 
Elementarausprägung aufweisen. 

Wie in Abbildung 68 auf S.172 exemplarisch dargestellt, kann die Beziehung 
eineindeutig sein. So wird z.B. der Elementarausprägung 2 der Öffnungsstufe 


60 Eineindeutig wird hier wie in der Mathematik gebraucht, also in der Bedeutung der umkehr- 
baren Eindeutigkeit: Was in der einen Richtung gilt, gilt auch in der anderen. 
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der Hinterzungenvokale, also ‚halbgeschlossen‘, genau ein Stützlaut, das [or], zu- 
gewiesen. Das Binärmerkmal, welches testet, ob die Öffnungsstufe 2 vorliegt, ist 
in diesem Fall nichts anderes als ein Test auf das Vorhandensein eines [o:], was 
später technisch als M-oo bezeichnet wird. Hier ist das Binärmerkmal eineindeutig 
mit der Elementarausprägung 2 verknüpft. Die Struktur stellt sich wie folgt dar: 


0! M-oo 2 


Neben diesem sehr einfachen Typus des Binärmerkmals gibt es auch solche, die auf 
mehr als einem Stützlaut aufbauen. In dem Test auf Entrundung der Vorderzun- 
genvokale bilden die hochdeutschen [ir/er/e] die Stützlaute für die ungerundeten 
Vorderzungenvokale und [y:/o:/ce] die Stützlaute für die runden Vorderzungenvo- 
kale. Die Elementarausprägungen sind 1 (ungerundet) und 2 (rund). Für die run- 
den Vorderzungenvokale, deren Binärmerkmal technisch mit M-RndFrnt bezeichnet 
wird, sieht das Strukturdiagramm so aus: 


yı 
Io —— M-RndFrnt ——2 


ce 


Auch können unterschiedliche Binärmerkmale derselben Elementarausprägung zu- 
gewiesen werden. Dieses Vorgehen ist gegenüber dem ‚Zusammenlegen‘ der Laute 
des vorigen Modells dann von Vorteil, wenn die Laute z.B. formanttechnisch in 
mehrere nicht zusammenhängende Bereiche fallen, was die Leistungsfähigkeit der 
Klassifikatoren einschränkt. Das ist etwa für die Elementarausprägung 3 der Öff- 
nungsstufe der Hinterzungenvokale, also ‚halboffen‘, der Fall: Hier werden zwei Bi- 
närmerkmale — Tests auf das Vorliegen der Laute [e] und [5] — angesetzt (technisch: 
M-E und M-O). Da es sich hierbei um einen Test auf Hinterzungenvokale handelt, 
wird der Test auf [5] als primäres Binärmerkmal und der auf [e] als sekundäres 
Binärmerkmal bezeichnet: 


Welches der beschriebenen drei Modelle für die Zuordnungen von Stützlaut — Bi- 
närmerkmal — Elementarausprägung verwendet wird, hängt von der Zielnutzung 
ab und ist prinzipiell frei wählbar. Die im VOKALJÄGER angesetzte Konstellation 
ist in Abschnitt 5.3.3 ab S. 197 im Detail dokumentiert. 

Der Stützlaut ist ein positiver Repräsentant für das Vorliegen des Binärmerk- 
mals. Die Kontrastlaute sind jene Laute, die repräsentativ für das Nicht-Vorliegen 
des Binärmerkmals stehen. So sind z.B. im VOKALJÄGER im Merkmal der Öff- 
nungsstufe der Hinterzungenvokale die Vokale [e/a:/o:] als Kontrastlaute zum Bi- 
närmerkmal [5] angesetzt. Stütz- und insbesondere Kontrastlaute im engeren Sinn 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


178 Algorithmische Klassifikationsphonetik 


sind ein Konzept des Binärmerkmals. Oft ist die Zuordnung zwischen Stützlaut, 
Binärelement und Elementarausprägung jedoch einfach und eindeutig. In diesen 
Fällen kann man auch von den Stützlauten der Elementarausprägung sprechen 
und muss das Binärmerkmal nicht explizit erwähnen. Sowohl Stütz- als auch Kon- 
trastlaute spielen eine tragende Rolle beim Training der mathematischen Binär- 
klassifikatoren, die im VOKALJÄGER die Wahrscheinlichkeiten für das Vorliegen 
bzw. Nicht-Vorliegen der Elementarausprägungen errechnen. 

Die Wahrscheinlichkeitsfunktionen bzw. Wahrscheinlichkeitswerte treten in ei- 
nem Ensemble miteinander in ‚Konkurrenz‘. Damit dieses Konzept sinnvoll ist, 
müssen die Binärmerkmale sich einander ausschließen. Abbildung 71 auf S.179 
zeigt exemplarisch Wahrscheinlichkeitsfunktionen in einem Ensemble. Es gibt de- 
finierte, aber nicht notwendigerweise zusammenhängende Bereiche, in denen genau 
ein Binärmerkmal den höchsten Wahrscheinlichkeitswert hat. Dies ist in Abbildung 
72 auf S. 180 veranschaulicht. 


Die Wahrscheinlichkeitsfunktionen der Binärmerkmale teilen den Raum 
der messphonetischen Lautsignale x hinsichtlich der Elementarausprä- 
gungen klassifikationsphonetisch untereinander auf. 


Wie kann man nun den Wahrscheinlichkeitswert des phonetischen Binärmerkmals, 
also die Wahrscheinlichkeitsfunktion p(x), bestimmen? Das ist die Aufgabe des 
sogenannten Binärklassifikators bzw. der mathematischen Klassifikation, Machine- 
Learning, was in Abschnitt 5.3 ab S. 192 eingeführt wird. 


5.1.4 Statistische Merkmalsdistanz 


Das Marburger Dialektalitätsmaß D- Wert, wie in Herrgen u.a. (2001, 3) beschrie- 
ben, basiert auf gemittelten Merkmalsdifferenzen zwischen einer Dialektprobe und 
einer hochdeutschen Entsprechungsreferenz. Es soll hier um das Konzept des glei- 
tenden Merkmals und der daraus abgeleiteten Differenzmaße erweitert werden. 
Betrachtet man die exemplarische Statistik über ein gleitendes Merkmal und 
verschiedene Laute in Abbildung 70 auf S. 176, drängt sich sofort eine Reihe von 
Fragen auf: Wo auf der Skala des gleitenden Merkmals liegt jeder Laut bzw. jede 
Lautgruppe? Wie groß ist auf dieser Skala der Unterschied zwischen zwei Lauten? 
Ist dieser Unterschied signifikant bzw. unterscheiden sich die Laute signifikant? Wie 
schon Abbildung 70 zeigt, existieren auch für hochdeutsche Sprecher auf der Skala 
des gleitenden Merkmals Variationen und Abweichungen von den Normwerten der 
Elementarausprägungen. Mögliche Gründe sind vielfältig. So mag der eine Spre- 
cher die Laute systematisch mit einer anderen Realisierung sprechen, als es es die 
Norm bzw. das Mittel vorgibt. Die Verfahren der Sprechernormalisierung, wie in 
Abschnitt 3.5, S. 74£., dargelegt, gleichen an den Referenzrahmen der hochdeutsch 
extremen Vokalen [ir/a:/u:] aus und normalisieren Streubreite, Zentrum usw. Sie 
werden aber immer relative Verschiebungen innerhalb dieses Referenzrahmens er- 
halten, so, ob z.B. ein [5] mehr oder weniger offen artikuliert wird, relativ zu einem 
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Abbildung 71: Die vier Bilder zeigen beispielhaft die Wahrscheinlichkeitsfunktio- 
nen p;(x) der der Abbildung 69 von $. 174 zugrundeliegenden Binärmerkmale (Anm.: 
Es handelt sich hierbei um die endgültige kalibrierte Form; vgl. Abschnitt 5.4.6 ab 
S.210). Als Repräsentant für x wird hier ebenfalls normalisiertes F1 auf der x-Achse 
gewählt. Dargestellt ist hier das Ensemble zum Bestimmen der Öffnungsstufe der 
Hinterzungenvokale. Die Binärmerkmale sind faktisch binäre Tests auf das Vorliegen 
bzw. Nicht-Vorliegen der Stützlaute [a:/o/o:/u:]. Je größer der Wahrscheinlichkeits- 
wert, desto wahrscheinlicher ist es, dass der entsprechende Laut vorliegt. Für z.B. das 
F1 von 7 Bark ist die Wahrscheinlichkeit, dass ein [a:] vorliegt, fast 1 und die Wahr- 
scheinlichkeit, dass doch etwa [»/o:/u:] vorliegt, jeweils fast 0. Da die hier untersuch- 
ten Lautproben, das dunkelgraue Band aus Abbildung 69, an der rechten Seite der 
F1/F2-Ebene liegen bzw. nur hintere Vokale abdecken, sind die Laute [a:/>/o:/u:] 
eindeutige Repräsentanten der Öffnungsstufen m; = 4,3,2,1. Die Kurven sind an 
den Stellen dunkel markiert, an denen das entsprechende Binärmerkmal die höchste 
Wahrscheinlichkeit aller Binärmerkmale im Ensemble hat, sich also ‚durchsetzt‘ und 
damit das am wahrscheinlichsten vorliegende Binärmerkmal ist. 
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Abbildung 72: In der normalisierten F1/F2-Ebene ist grafisch mit Symbolen mar- 
kiert, welches Binärmerkmal für welchen Lautsignalwert x = (F1,F») den höchsten 
Wahrscheinlichkeitswert hat (basierend auf dem Ensemble zur Bestimmung des Öff- 
nungsgrads der Hinterzungenvokale). Deutlich bilden sich zusammenhängende Flä- 
chen heraus. Angesetzt wurden die der Abbildung 69 auf S.174 zugrundeliegenden 
Binärmerkmale, die einfache binäre Tests auf das Vorliegen der Laute [e/a:/>/o:/u:] 
sind (mit einer späteren Zielnutzung zur Bestimmung der Öffnungsstufe der Hin- 
terzungenvokale). Ebenfalls getestet wurde auch auf den halboffenen Zentralvokal 
[fe]. Die unterschiedlichen Symbole markieren, welches Binärmerkmal die höchste 
Wahrscheinlichkeit hat (das Symbol D steht für [fe], die anderen ergeben sich aus 
den eingezeichneten Lautsymbolen). Mit vereinzelten Spiegelstrichen sind die ‚Über- 
gangsbereiche‘ zwischen den Binärmerkmalen markiert sowie das Gebiet, in denen 
keine aussagekräftigen Ergebnisse vorliegen (so scheitert das Ensemble der Öffnungs- 
stufe der Hinterzungenvokale erwartungsgemäß an den geschlossenen Vorderzungen- 
vokalen oben links im Bild). Wie erwünscht, decken sich die Bereiche, in denen ein 
Binärmerkmal ‚gewinnt‘ mit dem Areal, in dem es üblicherweise vorkommt, was mit 
den Interquartilellipsen angezeigt ist. 
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System, das von [ar], [u:] und [ir] messphonetisch aufgespannt wird. Zum anderen 
sind rein statistische Schwankungen zu erwarten. Diese sind systematischer Natur, 
wie z.B. durch allophonische Variationen oder aber auch, gerade in einem auto- 
matischen System, wie dem VOKALJÄGER, einfach Messfehler. Wie kann man in 
dieser statistischen Konstellation die Kernfrage - sind zwei Laute unterschiedlich 
— beantworten? 


Für den VOKALJÄGER gelten zwei Laute hinsichtlich eines Merkmals 
dann als unterschiedlich, wenn für die statistische Verteilung des ange- 
setzten gleitenden Merkmals gilt: (a) Die Zentren der Verteilung haben 
notwendig einen Mindestabstand auf der Skala des gleitenden phoneti- 
schen Merkmals und (b) der Abstand der Zentren ist statistisch signi- 
fikant. Dieser Abstand sei als statistische bzw. wahrscheinlichkeitsge- 
wichtete Merkmalsdifferenz bezeichnet. Ferner sollen (c) die Verteilun- 
gen hinreichend wenig überlappen. 


‚Unterschiedlich‘ als Merkmalsdistanz zu definieren, liegt auf der Hand. Die klas- 
sischen diskreten Elementarausprägungen haben den Abstand 1, eventuelle Dia- 
kritika-Halbschritte zählen nach der Marburger Dialektalitätskonvention mit %. 
Hier sind nun noch feinere Stufungen möglich. Die mathematischen Details und 
die Anwendung in der Dialektalitätsmessung werden in Abschnitt 5.2 ab S.182 
erläutert. 

Die statistische Merkmalsdistanz misst Abstände nach Transformation auf eine 
auf das Hochdeutsche normierte lineare eindimensionale und vor allem phoneti- 
sche Skala. Eine denkbare Alternative ist das euklidische Abstandsmaß bzw. eine 
L?-Norm, so etwa in Liljencrants/Lindblom (1972, 840). In der F1/F2-Ebene ent- 
spricht das Euklid-Maß der Länge einer Strecke zwischen zwei Formantpunkten. 
Es gibt manche Komplikationen mit dem Euklid-Maß. Offensichtlich problematisch 
sind die Randpunkte, was aus Abbildung 72 auf S.180 deutlich wird: Unabhängig 
davon, wie tief man in ein Randelement, z. B. [a], eindringt bzw. wie groß man hier 
F1 wählt und wie groß ein euklidischer Streckenabstand wird, es ändert nichts am 
phonetischen Abstand zum Nachbarelement, hier [5]. Im gleitenden Merkmalswert 
ist dies durch das Übergehen der Wahrscheinlichkeitsfunktionen in ein Plateau mit 
dem Wert ( = 4 gekennzeichnet, was für [a:] in Abbildung 71 auf S. 179 zu erken- 
nen ist, ebenso für C = 1 und [u:]. Der zweite Kritikpunkt ist, dass Streckenabstand 
und phonetischer Abstand der Elementarausprägungen nicht voll korrelieren. So 
ist auch nach auditorischer Normalisierung der Streckenabstand z.B. zwischen [a:] 
und [5] in Abbildung 72 auf S.180 größer als der zwischen [o:] und [u:], obwohl 
auch hier der phonetische Abstand identisch sein sollte. Das Konzept des gleiten- 
den Merkmals weist diese Komplikationen nicht auf. 
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Dieser Abschnitt detailliert, wie das im vorigen Abschnitt eingeführte Konzept des 
gleitenden Merkmals und der statistischen Merkmalsdistanz technisch im VOKAL- 
JÄGER umgesetzt wird - und wie es in der Dialektalitätsuntersuchung angewendet 
werden kann. Die exemplarisch für hochdeutsche Laute vorgestellten Arbeitsschrit- 
te und Darstellungsmethoden kommen für das Frankfurterische in Kapitel 9 ab 
S.283 zur Anwendung. 


5.2.1 Wert des gleitenden Merkmals in der Kontrastgruppe 


Gemessen wird mit dem VOKALJÄGER, welchen Wert das gleitende Merkmal spre- 
cherintrinsisch für eine bestimme Gruppe von Wörtern - hier Kontrastgruppe ge- 
nannt — annimmt. Die Kontrastgruppen und das zugrundeliegende Merkmal wer- 
den so bestimmt, dass sich aus diesen Gruppen repräsentative Paare - sogenannte 
Kontrastpaare — auswählen lassen, die kontrastiv für ein bestimmtes Muster des zu 
untersuchenden Dialekts stehen. Möchte man z.B. die Verdunklung des A als Mus- 
ter untersuchen, bietet sich als Merkmal die Öffnungsstufe der Hinterzungenvokale 
an. Ein Kontrastpaar kann man hier z.B. aus zwei Wortgruppen bilden: Zum einen 
die Gruppe der Wörter, die A in offener Tonsilbe haben und als Kontrast jene, die 
A in geschlossener Tonsilbe aufweisen. Ist die Öffnungsstufe signifikant kleiner in 
der ersten Gruppe, kann man davon ausgehen, dass hier Verdunklung vorliegt. 

Kontrastgruppen werden in diesem Text symbolisch markiert, nicht mit IPA- 
Lautzeichen. So soll z. B. die Gruppe jener Wörter, die A in Dehnung aufweisen, als 
Kontrastgruppe Ar bezeichnet werden°!. Die Gruppe der Wörter mit kurz gebliebe- 
nen A wird Kontrastgruppe A benannt. Das beispielhafte Kontrastpaar aus A und 
Ar wird mit [Aw A: | bezeichnet. Die einzelnen Kontrastgruppen und Kontrastpaa- 
re werden in dem entsprechenden Artikel zu den Lauten des Frankfurterischen in 
Kapitel 9 ab S. 283 definiert und im Detail erörtert. 

Wie ist nun das Vorgehen? Am Anfang steht der initiale Merkmalswert (’ 
aus Formel (35) von S. 171, der pro Lautprobe ermittelt wird. Errechnet werden 
soll das Zentrum der initialen Merkmalswerte innerhalb der Kontrastgruppe. Dies 
erfolgt in einem zweistufigen Prozess. Zuerst muss die Verzerrung innerhalb der 
Kontrastgruppe beseitigt werden, die aus den unterschiedlichen Häufigkeiten der 
enthaltenen Wörter resultiert (z.B. in der Kontrastgruppe der Dehnungs-A tre- 
ten Realisierungen des Wortstamms war ungleich häufiger auf als etwa die des 
Wortstamm fahren, wobei als Realisierungen nur jene gelten, die den Grundvokal 
erhalten). Hierzu wird der Mittelpunktswert (Median) pro Wortstamm 


Gem (ch) 


61Die Schreibmaschinen-Schrifttype soll den technischen Charakter anzeigen. 
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Abbildung 73: Berechnung der Merkmalsdifferenz Al aus den initialen Merkmals- 
werten (? pro Lautprobe, (! pro Wortstamm und Merkmalswerten C pro Kontrast- 
gruppe in einer Kaskade. 


über alle Lautproben bzw. alle Realisierungen i des Wortstamms j errechnet. 


5.2.1.1 Merkmalswert ( (Definition) 
Der Merkmalswert der Kontrastgruppe wird als Mittelpunktswert (Median) 


= (3) = (m (3) 2 


über alle Merkmalswerte & errechnet, also über alle Wortstämme 7 innerhalb ei- 
ner Kontrastgruppe. Der Merkmalswert einer Kontrastgruppe ist also das Zentrum 
aller Zentren pro Wortstamm. Das Diagramm in Abbildung 73 auf S.183 veran- 
schaulicht diese Kaskade. 

Der Merkmalswert G unterliegt statistischen Schwankungen, deren Größe mit 
dem Interquartilbereich dokumentiert wird®®. In grafischer Darstellung werden das 
25%- und das 75%-Perzentil eingezeichnet. Im Fließtext wird z.B. ( = 2,0 [1,8-2,0] 
notiert. Dies bedeutet, dass die Hälfte aller (-Werte in einem Band von 1,8 (25%- 
Perzentil) bis 2,0 (75%-Perzentil) liegen und dass der Mittelpunktswert, also das 


62Der Mittelpunktswert ist hier aus Gründen der Robustheit der Median m(z), also das 50%- 
Perzentil x(0,5)- 

63Eine Notation der Unsicherheit mit sonst üblichen +, die davon ausgeht, dass der Fehler 
symmetrisch ist, erscheint unangebracht, da die Schwankungsbreiten asymmetrisch sind. Ins- 
besondere sind die (-Schwankungen auf den Wertebereich, der durch die größte und kleinste 
Elementarausprägung gegeben ist, beschränkt: Gleich z.B. wie unsicher ein ( auf der Öffnungs- 
stufe der Hinterzungenvokale ist, niemals etwa wird ein ( > 4 möglich sein. Analog gilt AG >0. 
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Öffnungsstufe O-Laute 
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Abbildung 74: Beispiel: Untersuchung der kurzen O-Laute (links Kontrastgruppe 
0) und der langen O-Laute (rechts Kontrastgruppe Or). Dargestellt ist die Vertei- 
lung der Werte des gleitenden Merkmals der Öffnungsstufe der Hinterzungenvokale 
( für exemplarische Sprecher des Hochdeutschen. Der Zahlenwert und das Symbol 
bezeichnen den Median, der Strich den Interquartilbereich. Das obere Zahlenpaar 
protokolliert die Probenzahl n und Zahl der Stämme bzw. Wörter w, jeweils ge- 
trennt mit dem Zeichen ‚/‘. Die Raute markiert die Werte über alle Sprecher des 
Hochdeutschen. Der Merkmalswert des kurzen O liegt nahe dem im Hochdeutschen 
zu erwartenden ( = 3, der des langen O entsprechend bei ( = 2. Für die Sprecher 
K62BE und KO9MR liegt ( hier unterhalb des üblichen Werts. 
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50%-Perzentil, C = 2,0 ist. Es kann durchaus passieren, dass das 25%-, 50% und 
75%-Perzentil identisch sind — in diesem Fall ist die Verteilung sehr schmal. Die 
angegebene Genauigkeit bzw. Anzahl der Stellen folgt den üblichen Konventionen 
(vgl. Abschnitt A.2.4 auf $. 439). 

Schaubild 74 auf S. 184 exemplifiziert das Konzept anhand der im Hochdeut- 
schen zu erwartenden unterschiedlichen Qualitäten des kurzen und des langen O- 
Lauts: Die Gruppe der Wörter mit langen OÖ sollte andere ( annehmen als die der 
kurzen ©. Für den Merkmalswert der Öffnungsstufe der Hinterzungenvokale müss- 
te im Hochdeutschen für das lange geschlossene [o:] ein d = 2 und für das kurze 
offene [5] ein = 3 gelten, was sich auch schön zeigt. Wichtig ist es, anzumerken, 
dass einzig aus einer deutlichen Abweichung eines ( von der hochdeutschen Norm 
einer einzelnen Gruppe nicht sofort geschlossen werden kann, dass hier ein phone- 
tisch-phonologisch relevantes Muster vorliegt. Dies ist nur der Fall, wenn die ( der 
Kontrastgruppe(n) diesen Befund in einer signifikanten Distanz bestätigen. 


5.2.2 Sprecherintrinsische Merkmalsdifferenz im Kontrastpaar 


Im nächsten Schritt wird getestet, ob sich die Kontrastgruppen hinsichtlich des 
Merkmalswerts ( innerhalb eines Sprechers signifikant unterscheiden. Dazu soll die 
statistische Merkmalsdifferenz im Kontrastpaar errechnet werden. Aus der Signifi- 
kanz bzw. Nicht-Signifikanz des Unterschieds kann dann das Vorliegen bzw. Nicht- 
Vorliegens eines Musters für den Sprecher geschlossen werden. Ob dies Dialektalität 
bedeutet, hängt vom Kontext ab: Ein signifikanter Unterschied in der Öffnungs- 
stufe zwischen kurzem A und Dehnungs-A ist etwa ein Dialektalitätsmerkmal des 
Frankfurterischen. Aber ein signifikanter Unterschied zwischen kurzem O und lan- 
gem O in der Artikulation eines Sprechers ist gerade kein Dialektalitätsmerkmal, 
denn dieser qualitative Unterschied ist zwar wesentlich für das Hochdeutsche, doch 
der Dialekt weist ihn nicht auf. Das Vorgehen, sprecherintrinsisch Kontrastgruppen 
auszuwerten, ist zwingend nötig: 


Nur wenn ein Sprecher in seiner eigenen Sprechweise signifikant unter- 
schiedlich in zwei Wortgruppen artikuliert, gemessen auf einer Skala 
des Hochdeutschen, darf man davon ausgehen, dass die Wortgruppen 
bzw. die darin enthaltenen Laute phonetisch getrennt sind. Nur aus 
phonetisch unterschiedlichen Wortgruppen können phonetisch-phono- 
logische Schlüsse über Muster eines Dialekts abgeleitet werden. 


So mag z.B. das ( des kurzen O-Lauts gegenüber dem hochdeutschen [5] signifikant 
zum [o:] hin verschoben sein. Solange aber dieser kurze O-Laut noch signifikant 
vom langen O-Laut des Sprechers unterschieden ist, muss man davon ausgehen, 
dass kurzer und langer O-Laut nicht in einem Laut, etwa [o], zusammenfallen, 
wie dies z.B. für einen Dialekt der Fall sein kann - eine Erklärung kann in einem 
solchen Fall das ‚Ausweichen‘ des langen O-Lauts zu niedrigerem ( sein: obwohl 
nun sowohl kurzer und langer O-Laut von der hochdeutschen Norm abweichen, 
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Distanzen: Öffnungsstufe O-Laute 
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Abbildung 75: Beispiel: Untersuchung des qualitativen Kontrasts der O-Laute in- 
nerhalb eines Sprechers anhand der Merkmalsdistanz AG hinsichtlich des gleitenden 
Merkmals der Öffnungsstufe der Hinterzungenvokale. Dargestellt sind ausgewählte 
hochdeutsche Sprecher aus HG1 und HG2. Gezeigt ist mit dem schwarzen Quadrat 
der Merkmalswert ( der Referenz (oben: der lange O-Laut) und mit dem kurzen 
horizontalen Strich der Merkmalswert ( des Vergleichslauts (unten: der kurze O- 
Laut). Der vertikale Strich und die Zahl zeigen die Differenz A an. Referenz- und 
Vergleichslaut gelten als unterschiedlich, falls die Distanz AC signifikant ist, was 
mit unterschiedlichen Symbolen angezeigt ist (x: hoch signifikant; »*: signifikant; 
‚ls‘: vermeintlich signifikant, aber zu geringe Probenzahl; ‚th‘: Minimaldistanz nicht 
erreicht; ‚ns‘: nicht signifikant). Die Bhattacharyya-Distanz (COS) misst das Nicht- 
Überlappen der Verteilungen (hier: 1, stark überlappend bis 4, weitgehend getrennt; 
vgl. Abschnitt 5.2.3 ab S.191). Die Merkmalsdistanzen AQ liegen im Bereich des- 
sen, was man für den Unterschied zwischen [o:] und [5] im Hochdeutschen erwartet: 
AG = 1. Alle Unterschiede sind hoch signifikant. ‚HD‘ zeigt die Mediane der hoch- 
deutschen Mediane an. 
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halten sie ihre zur Unterscheidung notwendige Distanz aufrecht und bestätigen so 
das hochdeutsche Muster. 


5.2.2.1 Statistische Merkmalsdifferenz Al (Definition) 


Es soll der Abstand zwischen den zwei Kontrastgruppen 1 und 2 eines Sprechers 
bzw. die Merkmalsdifferenz innerhalb des Kontrastpaars [1 2] errechnet werden. 
Das Kontrastpaar werde durch die Zentren der gleitenden Merkmale (ı und & 
jeweils nach Formel (36) von $.183 repräsentiert. Mathematisch-technisch sei die 
Merkmalsdifferenz nun als der Betrag der Differenz bzw. des Abstands 


A = di = Cal 


definiert. AC® sei als originäre Merkmalsdifferenz bezeichnet. Signifikanzüberlegun- 
gen haben noch keinen Eingang gefunden. AC° ist eine statistische, sprecherintrin- 
sische Größe. Aber nur ein signifikanter Unterschied schlägt sich in der endgültigen 
Merkmalsdifferenz 


Nez | AC’=|G-(Ce| : Abstand ist signifikant, 


0 : sonst, en 


nieder (zur symbolischen Darstellung vgl. auch das Diagramm 73 auf S. 183). Nicht 
signifikante originäre Merkmalsdifferenzen AC® werden also aus der finalen Merk- 
malsdifferenz ‚ausgeblendet‘. Die sprecherintrinsische Merkmalsdifferenz ist kom- 
mutativ: AG ist identisch in den Kontrastpaaren [12] und [21]. AC ist die 
zentrale Messgröße des VOKALJÄGERS. 

Als Beispiel nehme man als Gruppe 1 das neutrale A des Frankfurter Stadt- 
dialekts und als Gruppe 2 das dunkle A. Misst man für die Gruppe 1 ein Ci = 3,9 
auf der Skala des Öffnungsgrads der Hinterzungenvokale und für die Gruppe 2 ein 
(a = 2,8, ergibt sich ein AC® = 1,1. Falls die originäre Merkmalsdifferenz AC® signi- 
fikant ist, erhält man eine ebensolche endgültige Merkmalsdifferenz AC = 1,1. Ist 
sie das nicht, gilt AC = 0, obwohl der nominale, originäre Abstand mit AC’=1,1 
sehr groß ist. 

Die Merkmalsdifferenz in der hier niedergeschriebenen Form ist sprecherintrin- 
sisch. Ergänzend kann man die Differenz einer Kontrastgruppe zu einer hochdeut- 
schen Referenzgruppe errechnen, also einen sprecherextrinsischen Bezugsrahmen 
setzen. Da jedoch die sprecherintrinsische Unterscheidung zwischen bzw. die Tren- 
nung von zwei Lautgruppen für die Dialektalitätsbeurteilung hauptsächlich ist und 
die Abweichung von einer abstrakten hochdeutschen Referenz eher sekundäre Be- 
deutung hat, sollen Methode und Messungen zu einem solchen ACH? nur ergänzend 
beigefügt werden (vgl. Anhang A.4.2, S. 449£.). 


5.2.2.2 Binäre Dialektalität (Definition) 


Wünscht man eine binäre Aussage über das Vorliegen eines Dialektmusters be- 
züglich einer normalisierten Version des Dialekts zu treffen — hier gegebenenfalls 
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mit einem x markiert — bietet sich ein Analysieren der AC an: Ist das den Dialekt 
auszeichnende Muster ein Zusammenfall der Laute hinsichtlich eines bestimmten 
Merkmals, muss notwendig AG = 0 sein. Ist das Muster hingegen eine Trennung 
der Laute bzw. ein Nicht-Zusammenfallen, wird in dieser Arbeit notwendig ein 
AC > 0,5 erwartet, was einem Diakritikum-Schritt im Marburger D-Wert ent- 
spricht®*. Der Absolutwert ( des gleitenden Merkmals soll hingegen nur als hin- 
reichende Nebenbedingung angesetzt werden: Hier bietet sich ein Toleranzbereich 
von einem Diakritikum-Schritt an, also  — 0,5 <( < (+ 0,5. Dabei ist (’ der 
erwartete ‚Zielwert‘, wie ihn der Dialekt theoretisch vorgibt. 

Im Beispiel des dunklen A würde man z.B. von einer binären Dialektalität spre- 
chen, falls ein signifikanter Abstand AG > 0,5 zum neutralen A vorliegt (notwen- 
dige Bedingung) und das Dehnungs-A im Bereich 2,5 < ( < 3,5 liegt, wobei (’ = 3 
für den offenen O-Laut angesetzt wurde (hinreichende Nebenbedingung). Für das 
exemplarische Messergebnis ist dies mit AC=11>05 und 25 <(@da=28<3,5 
erfüllt und das dunkle A würde hier als binär dialektal «x markiert werden. 


5.2.2.3 Numerische Dialektalität (Definition) 


Die Merkmalsdifferenz A( kann konzeptionell als der Elementarbaustein des Mar- 
burger D-Werts aus Herrgen u.a. (2001, 2), der qualitativen Segmentdifferenz ge- 
deutet werden, wenn eine Kontrastgruppe dem hochdeutschen Referenzwert ent- 
spricht und die andere dem zu untersuchenden dialektalen Muster‘. In diesem 
Fall ist die erwartete Merkmalsdifferenz AC > 0 und man kann als numerische 
Dialektalität 


AC’=|G-(@]|  : Abstand ist signifikant und 
DA binäre Dialektalität liegt vor, (38) 
0 ; sonst, 


ansetzen, die konzeptionell auf der Skala des D-Werts läuft: Die Merkmalsdistanz 
AG wird interpretiert als eine Distanz zum Hochdeutschen. Im vorherigen Beispiel 
im Kontrastpaar aus neutralem A (Cı = 3,9) und dunklem A (GC = 2,8) entspricht 
die erste Gruppe, also neutrales A, der hochdeutschen Referenz. Entsprechend 
ergibt sich als Dialektalität 9 = 1,1. Dabei ist d dann ein D-Wert-ähnliches Maß für 
die Dialektalität der zweiten Gruppe, des dunklen A. Im Fall der Nicht-Signifikanz 
des Unterschieds der Lautgruppen, wie sie z.B. für das Hochdeutsche üblich ist, 
ergibt sich entsprechend eine numerische Dialektalität von V =. 

Im Fall, dass das dialektale Muster einem Zusammenfall der Laute entspricht, 
also die erwartete Merkmalsdifferenz AC = 0 beträgt, muss anders vorgegangen 
werden. Aus dem Zusammenfall der Laute beider Gruppen bzw. ihrer nicht vorhan- 
denen Unterscheidbarkeit ergibt sich ein mittleres Zentrum der Lautgruppen von 


64Letzteres gilt unter der Annahme, dass die Merkmalsschrittweite hinsichtlich ( dem Wert 1 
entspricht, was im VOKALJÄGER durchweg die Regel ist. 

65 Voraussetzung ist natürlich auch, dass die C bzw. AC zugrundeliegende Merkmalsskala mit 
der des D-Werts kompatibel ist, was aber in der Regel der Fall sein sollte. 
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1/2Cı + 1/2Ca. Man kann nun annehmen, dass dieses Zentrum dadurch entstanden 
ist, dass sich eine der beiden Lautgruppen von einem hypothetischen Referenz- 
Merkmalswert (* auf der Skala des Hochdeutschen entfernt hat. Damit ergibt sich 
als numerische Dialektalität 


Yyadı + ala - (| : Abstand ist nicht signifikant und 
V= binäre Dialektalität liegt vor, (39) 
0. : sonst (Abstand ist signifikant). 


Als Beispiel nehme man das Kontrastpaar aus im Hochdeutschen runden Vorder- 
zungenvokalen, die im Frankfurterischen entrundet sind, z.B. Ü und den unge- 
rundeten Vorderzungenvokalen, z.B. I- also [UI]. Im Frankfurterischen könnte 
man z.B. für ein ungerundetes I ein (a = 1,1 auf der Skala des Rundungsgrads 
der Vorderzungenvokale messen, wobei ein d — 1 für ungerundete Vokale steht. 
Im Hochdeutschen könnte man für das runde Äquivalent, das U, möglicherweise 
ein (ji = 2 messen, was für einen runden Vokal steht. Das Frankfurterische ist aber 
entrundet und man würde hier für einen Laut mit hochdeutscher Ü-Entsprechung 
vielleicht ein (ı = 1,0 messen — die Frankfurterische U-Realisierung hat sich von 
ihrer hochdeutschen Norm (* = 2 bzw. ‚rund‘ entfernt. Damit fallen beide Laut- 
gruppen in einem Zentrum von 1/2Cı + !/2Ca = 1,05 zusammen. Für das Frank- 
furterische ist die erwartete Merkmalsdifferenz AC = 0 und der hypothetische 
Referenz-Merkmalswert des Ü ist (* = 2, also rund. Entsprechend ergibt sich hier, 
falls beide Gruppen keinen signifikanten Abstand haben, eine Dialektalität hin- 
sichtlich des Rundungsgrads von 9 = |1,05 — 2| = 0,95. Die Dialektalität des Ü 
bezüglich Entrundung ist dann d = 0,95, also recht groß. Die Interpretierbarkeit 
der numerischen Dialektalität d muss allerdings in diesen Fällen gegenüber der 
Merkmalsdifferenz Al in der Bedeutung zurücktreten, da mit (* eine sprecherex- 
trinsische Größe einfließt®. 

Gleich der Merkmalsdifferenz AC ist der D-Wert, zumindest implizit, sprecher- 
intrinsisch. Der D-Wert ist zum einen allgemeiner, da er ein Mittel über verschie- 
dene konsonantische und vokalische Realisierungen bzw. Segmentdifferenzen bildet 
- AC in der Form aus Formel (37) von S.187 untersucht ein und nur genau ein 
vokalisches Phänomen®’. Zum anderen ist der D-Wert im Ergebnis quantisiert in 
Schritten zu 0,5 - eine Einschränkung, die das Konzept der statistischen Merkmals- 
differenz AC bewusst mit einem Überhang auf eine kontinuierliche Skala verwirft. 
Der D-Wert setzt auf einem phonetischen Transkript auf, das schon qualitätsgesi- 


66C* sei hier als der Wert der abstrakten normalisierten Referenzskala des Hochdeutschen an- 
gesetzt. Alternativ könnte man hier auch einen numerisch bestimmten Wert, wie e HD aus Formel 
(51) von $S.449 verwenden, doch sind in der Praxis die Unterschiede gering. Die Verwendung 
einer sprecherintrinsischen Referenz bzw. dem Test auf ein Ad > 0 mit dieser Referenz ist in 
der Regel nicht möglich, da die hochdeutsche Referenzgruppe im Dialekt nicht existiert bzw. zu 
dünn populiert ist. 

67 Auch beruht der D-Wert mathematisch auf dem klassischen Mittelwert, wohingegen AC 
aus Gründen der Robustheit gegenüber möglicherweise korrupten Messdaten auf dem Median 
aufsetzt. 
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chert ist. Der VOKALJÄGER benötigt ein solches nicht: AC wird direkt und ohne 
menschliche Intervention aus dem Sprachsignal errechnet. Es ist durchaus denkbar, 
die abgeleitet numerische Dialektalität 9 als Segmentdifferenz mit einer nachgela- 
gerten klassischen D-Wert-Berechnung zu kombinieren, die dann andere, zurzeit 
mit dem VOKALJÄGER noch nicht messbare Dialektalitätsmerkmale berücksich- 
tigt. 


5.2.2.4 Schwankungsbreite und Signifikanz (Definition) 


Die Merkmalsdifferenz AC’ unterliegt statistischen Schwankungen, die sich aus 
den Schwankungsbreiten der zugrundeliegenden Merkmalswerte (ı und (a der je- 
weiligen Kontrastgruppen 1 und 2 ergeben. Aus diesen Schwankungen kann nun 
abgeleitet werden, ob die Merkmalsdifferenz signifikant ist oder nur statistisch 
zufällig. Wann gilt nun die Merkmalsdifferenz AC® bzw. der Lautunterschied als 
signifikant? Im VOKALJÄGER werden folgende Signifikanzniveaus a angesetzt: 


— Hoch signifikant (x*): Die Signifikanz des Unterschieds der Zentren folgt 
der klassischen Überlegung einer t-Statistik, die auf Mittelwertsunterschieden 
aufsetzt (vgl. Abschnitt A.2.5 ab S.440). Doch wird hier, um die Robust- 
heit sicherzustellen, anstatt des Mittelwerts der Median angesetzt, weswegen 
der klassische Ansatz der t-Statistik nicht mehr greift. Vielmehr wird nicht- 
parametrisch mittels Bootstrapping (N = 5.000) eine Verteilung der Mediane 
Gı und (3 erzeugt und geprüft, ob das ‚obere‘ 99%-Perzentil von (ı noch kleiner 
als das ‚untere‘ 1%-Perzentil von (; ist, wobei hier natürlich angenommen wird, 
dass (ı < Ca gilt. Sind C, und (a auf dem 99%-Signifikanzniveau unterschied- 
lich, wird das hier als hoch signifikant bezeichnet (bzw. p < 0,01). Aufgrund 
der dünnen Population erscheint es nicht sinnvoll, bessere Signifikanzniveaus 
als 99% auszuweisen. 


— Signifikant (x): Entsprechend hoch signifikant, aber auf dem 95% Signifikanz- 
niveau (bzw. p < 0,05). 


— Nicht signifikant (ns): Liegt das Signifikanzniveau unter 95% bzw. p > 0,05, 
gilt die Merkmalsdifferenz AC® als nicht signifikant und es wird für die endgül- 
tige Merkmalsdifferenz AG = 0 ausgewiesen (‚ns‘ von engl. not significant). 


— Zu geringer Abstand (th): Nominal signifikante und hoch signifikante ori- 
ginäre Merkmalsdifferenzen Al’, die weniger als die Hälfte des Werts des 
Diakritikum-Schritts im Marburger D-Wert-Konzept aufweisen, werden pau- 
schal als zu gering angesetzt, um eine dialektale Unterschiedsaussage treffen 
zu können (‚th‘ von engl. threshold). Im Fall von Al < 0,25 wird also für die 
endgültige Merkmalsdifferenz Al = 0 ausgewiesen. 


— Zu geringe Probenzahl (ls): Originäre Merkmalsdifferenzen Al”, die im 
Bootstrapping als signifikant und hoch signifikant erscheinen, aber auf einer zu 
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geringen Probenzahl basieren, werden ebenfalls als nicht belastbar angesehen 
(‚Is‘ von engl. low sample numbers). Details zur Mathematik finden sich in An- 
hang A.4.3 ab S. 451. In diesem Fall wird für die endgültige Merkmalsdifferenz 
AC = 0 ausgewiesen. 


Die Signifikanz ist die wesentliche Information und wird durchweg in den Grafi- 
ken und Tabellen dokumentiert. Bei Zitation einer Merkmalsdifferenz im Fließtext 
wird darüber hinaus noch die Schwankungsbreite derselben angegeben. Genauso, 
wie bei ( wird das 25%- und das 75%-Perzentil angegeben®. So bedeutet z.B. 
AC = 1,8** [1,5-1,8], dass die Hälfte aller AC® innerhalb des Bandes von 1,5 
(25%-Perzentil) und 1,8 (75%-Perzentil) liegen. Der Mittelpunktswert, also das 
50%-Perzentil, beträgt hier AC’ = 1,8. In diesem Fall wurde ein hoch signifikantes 
AC® gemessen, was durch die ** angezeigt ist. Die 25%-, 50%- und 75%-Perzentile 
können zusammenfallen, was für eine sehr schmale Verteilung spricht. Nicht signi- 
fikante AC’-Werte werden in Klammern gesetzt, z.B. AC = (0,5)"* [0,0-0,5]. In 
diesem Beispiel wurde ein originäres AC® = 0,5 gemessen, das aber nicht signifi- 
kant ist (ns). Endgültig ergibt sich so ein AC = 0. Die angegebene Genauigkeit 
bzw. Anzahl der Stellen folgt den üblichen Konventionen (vgl. Abschnitt A.2.4 auf 
9.439). 

Schaubild 75 auf S. 186 veranschaulicht und erläutert das Konzept exemplarisch 
an dem hochdeutsch zu erwartenden qualitativen Kontrast zwischen den kurzen 
und langen O-Lauten. 


5.2.3 Ergänzung: Die Bhattacharyya-Distanz (COS) 


Ein abschließendes, aber eher informatives Kriterium ist die Forderung nach einer 
möglichst großen Nicht-Überlappung der Merkmalswerte zwischen zwei Kontrast- 
gruppen. Überlappung von Verteilungen wurde schon in Abschnitt 4.4.2, S. 141f., 
getestet. Aber anders als dort sind auf Kernelschätzungen basierende Maße hier 
unstabil, da die Populationen recht klein sind und stärker streuen. So muss ein 
Maß angesetzt werden, das robust auf empirischen Häufigkeitsverteilungen auf- 
setzt. Hier fiel die Wahl auf die Bhattacharyya-Distanz in einer in der Bildver- 
arbeitung erprobten Form (Bhattacharyya [1943] und Comaniciu/Ramesh [2000, 
3]). Die Bhattacharyya-Distanz — in dieser Arbeit abgekürzt COS für coefficient 
of separation — nimmt theoretisch Werte zwischen 0 (vollkommene Trennung) und 
1 (Identität) an. In grafischen Auswertungen ist die Ausprägung der COS in vier 
Stufen angezeigt”. Zu Details sei hier auf Anhang A.2.7 ab S. 441 verwiesen. 


68Das 25%-und 75%-Perzentil von Al? wird aus den 25%-und 75%-Perzentilen der einzelnen 
Gı und (> konservativ abgeschätzt. Es werden die größten bzw. kleinsten Differenzen angesetzt, 
die sich aus den einzelnen Perzentilen zwischen den Kontrastgruppen ergeben. 

69Die COS-Wertebereiche mit den pauschal zugeordneten Wertebereichen sind 1: 0,00-0,50; 2: 
0,50-0,75; 3: 0,75-0,90 sowie 4: 0,90-1,00. 
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5.3 Die Klassifikatoren des VokalJägers 


5.3.1 Einführung 


Was ist mathematische Klassifikation? Ziel ist es, eine möglichst genaue Vorher- 
sage, prediction, über das Vorliegen eines bestimmten Merkmals, feature, in einem 
Datensatz, sample, machen zu können. „Predictive Modelling: The process of deve- 
loping a mathematical tool or model that generates an accurate prediction“ (Kuhn/ 
Johnson 2013, 2). Für den VOKALJÄGER geht es darum, gewisse klassifikations- 
phonetische Merkmale eines Lauts aus messphonetischen Daten zu schätzen. Das 
Grundkonzept der Klassifikation mit den zu durchlaufenden Schritten ist in Abbil- 
dung 76 auf S. 193 in einem Ablaufblockdiagramm dargestellt. Was hier als mathe- 
matische Klassifikation bezeichnet wird, fällt in einen mathematisch-technischen 
Bereich, der üblicherweise mit den englischen Begriffen predictive modelling oder 
machine learning, pattern classifier bzw. recognition, data mining, multivariate 
statistics, factor analysis usw. bezeichnet wird. Die Darstellung folgt im Wesent- 
lichen Kuhn/Johnson (2013) und weiterer verwendeter Fachliteratur (Venables/ 
Ripley [2002], Härdle/Simar [2003], Witten/Frank [2005], Zhang/Ma [2012] und 
Kuncheva [2014]). Die Bezeichnungen wurden hier, wo es sinnvoll erscheint, be- 
hutsam aus dem Englischen übertragen und auf den VOKALJÄGER angepasst. Die 
einzelnen Elemente werden nun im Folgenden beschrieben. 

Am Anfang der allgemeinen Prozesskette stehen die Rohdaten. Aus diesen wird 
im Schritt der Vorverarbeitung ein Satz von repräsentativen Variablen, den Attri- 
buten, extrahiert bzw. errechnet. Für den VOKALJÄGER entspricht das dem in Ka- 
pitel 3 ab S. 35f. beschriebenen Vorgehen: Die Rohdaten sind das Lautschallsignal 
bzw. die daraus errechneten akustischen Messwerte und die Vorverarbeitung ist 
die Bereinigung und robuste Normalisierung derselben. Die sich ergebenden akus- 
tischen Größen, wie z. B. robust lobanovnormalisierte Formanten, bilden dann die 
Attribute. Aus den Attributen wird eine Untermenge ausgewählt, die sogenannten 
Prädiktorvariablen, die dann den Startpunkt des eigentlichen Klassifikators bil- 
den. Die Hoffnung und Vermutung ist, dass die ausgewählten Prädiktorvariablen 
genug Information enthalten, ein bestimmtes Merkmal der Daten umfassend zu be- 
schreiben. Ist diese Voraussetzung erfüllt, sollte ein geeigneter Klassifikator in der 
Lage sein, aus den Daten ein geschätztes Merkmal zu bestimmen, das im Idealfall 
mit dem originalen Merkmal übereinstimmt’®. Für Klassifikation, classification, 


70In der Literatur findet man eine Vielzahl von alternativen Bezeichnungen für die hier ein- 
geführten Begriffe. Hier wurde bewusst begrifflich zwischen dem Satz an prinzipiell verfügbaren 
Variablen, hier den Attributen, und dem Satz der in den Klassifikator eingehenden Variablen, 
hier den Prädiktorvariablen, unterschieden. Allgemein gebräuchliche Begriffe sind predictors, in- 
dependent variables, attributes oder descriptors. Das Schätzermodell ist der classifier oder die 
prediction equation. Die Schätzerantwort bzw. das geschätzte Merkmal wird als outcome, depen- 
dent variable, target, class, response oder prediction bezeichnet. 
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Rohdaten 


Vorverarbeitung 


Attribute 


Prädiktorvariablen 


EB Schätzer 


Schätzermodell 


Schätzerantwort 


Ensemble 


Lauteigenschaft 


Klassifikator 


originales Merkmal 


Beurteilung der Schätzgüte 


geschätztes Merkmal 


Abbildung 76: Grundkonzept und Prozessschritte der mathematischen Klassifika- 
tion. Der eigentliche Klassifikator besteht aus (1) den zu schätzenden Merkmalen, (2) 
einer Auswahl von Variablen, den Prädiktorvariablen und (3) dem mathematischen 


Schätzermodell. 
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im engeren Sinn ist das Merkmal eine ordinale Größe mit mehreren diskreten Aus- 
prägungen (Klassen). Im einfachsten Fall ist das ordinale Merkmal binär. Damit 
gibt es nur zwei Klassen, die die Ausprägungen ‚wahr‘ und ‚falsch‘ abbilden. Das 
entspricht der Situation im VOKALJÄGER mit seinen Binärmerkmalen (vgl. Ab- 
schnitt 5.1.3 ab S. 176). Die Auswahl der Prädiktorvariablen ist kritisch und hängt 
vom zu schätzenden Merkmal ab. So mag man versuchen, zur Klassifikation einzig 
den ersten Formanten heranzuziehen. Der Satz der Prädiktorvariablen wäre dann 
nur und nur F1. Das mag zum Erkennen eines [a] bzw. des Merkmals ‚offen‘ auf- 
grund der exponierten Stellung dieses Vokals ausreichen, aber ist für alle anderen 
Merkmale ungeeignet. Geeigneter scheint der Übergang auf mehrere Formanten 
zu sein. So kann man z.B. Fl, F2 und F3 als Prädiktorvariablen wählen. Auch 
stellen sich die Fragen, ob man normalisierte Formanten ansetzt und/oder origina- 
le nicht normalisierte Formanten, welche Normalisierung man wählt, ob man die 
Grundfrequenz, Intensität oder Lautdauer hinzuzieht oder nicht usw. 

Diese Prädiktorvariablen werden in einem mathematischen Schätzermodell al- 
gorithmisch prozessiert. Das Schätzermodell errechnet eine Schätzerantwort, die 
eine Maßzahl für das geschätzte Merkmal ist. Für ein ordinales Merkmal kann man 
unter Vorbehalt die Schätzerantwort als Wahrscheinlichkeit, dass das Merkmal eine 
bestimmte Ausprägung aufweist, interpretieren bzw. in eine solche überführen (vgl. 
Abschnitt 5.4.6 ab S. 210). Nicht notwendigerweise nutzt das Schätzermodell die 
Prädiktorvariablen unmittelbar. So kann das Modell eine geeignete Transformati- 
on auf eine interne Alternativdarstellung durchführen, die oft kompakter als die 
originalen Variablen ist (das klassische Beispiel ist die Transformation auf Haupt- 
komponenten, principal components, als Methode zur Datenreduktion). Für den 
VOKALJÄGER gilt: 


Die sogenannten Binärklassifikatoren des VOKALJÄGERS schätzen die 
Wahrscheinlichkeitswerte der phonetischen Binärmerkmale (vgl. Ab- 
schnitt 5.1.3, S.176£.). Die drei Bausteine des Binärklassifikators im 
VOKALJÄGER sind (1) die Definition des Binärmerkmals, insbeson- 
dere die Zuordnung der Stütz- und Kontrastlaute; (2) die Wahl der 
Prädiktorvariablen und (3) die Wahl des mathematischen Schätzermo- 
dells. 


Die Bausteine sind mit den Ziffern 1 bis 3 in Abbildung 76 auf S. 193 markiert. Der 
VOKALJÄGER nutzt nur ordinale Klassifikation in ihrer strengsten, der binären, 
Form. Für diese Form liegen die meisten Klassifikationsalgorithmen vor und die 
Kalibrierung gestaltet sich einfach. Der Übergang auf mehrere Klassen und kon- 
tinuierliche Größen erfolgt ausschließlich über nachgelagerte Konstrukte, den Ele- 
mentarausprägungen und dem gleitenden phonetischen Merkmal (vgl. Abschnitt 
5.2.1, 8.182 £.)"t. 


"1Dje statistische Alternative, die Machine-Learning ‚Schwester‘ der diskreten Klassifikation, 
die Regression, arbeitet vollständig mit kontinuierlichen Größen. Dieser Ansatz erbrachte im 
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Das gleitende phonetische Merkmal schafft den Rahmen, das Ensemble, in den 
die Binärklassifikatoren des VOKALJÄGER eingeordnet werden. Am Anfang steht 
die genaue Definition des gleitenden Merkmals, insbesondere der Elementarausprä- 
gungen bzw. der Binärelemente, aus denen sich prinzipiell die benötigten Binär- 
klassifikatoren ergeben (vgl. Abschnitt 5.3.2 ab S. 195). Diese weisen allerdings in 
der Detailgestaltung ihrer drei zugrundeliegenden Komponenten erhebliche Frei- 
heitsgrade auf, die in den Folgeabschnitten diskutiert werden (Binärmerkmale: 
Abschnitt 5.3.3 ab S. 197; Prädiktorvariablen: Abschnitt 5.3.4 ab S. 200; Schätzer- 
modelle: Abschnitt 5.3.5 ab S. 200). 


5.3.2 Die gleitenden Merkmale 


Im VOKALJÄGER finden mathematische Klassifikatoren zur Messung von Dialek- 
talität Anwendung. Als numerisches Maß wird das Konzept des gleitenden pho- 
netischen Merkmals aus Abschnitt 5.1, S. 170 f., angesetzt. So stellt sich die Fra- 
ge, welche Merkmale wie vermessen werden sollen. Die Antwort findet sich in der 
Struktur des zu untersuchenden Dialekts. Für jeden Dialekt bietet es sich an, ange- 
passte gleitende Merkmale zu konstruieren, die genau die Eigenheiten der Mundart 
herausarbeiten. Die für das Frankfurterische maßgeblichen Muster sind die der Öff- 
nungsstufe und der Entrundung, die im Folgenden als gleitende Merkmale definiert 
werden: 


5.3.2.1 Gleitendes Merkmal Öffnungsstufe 


Wesentliche Unterschiede des Frankfurterischen zum Hochdeutschen liegen erstens 
in Verschiebungen des Öffnungsgrads. So ist z.B. ein prägendes Muster des Frank- 
furterischen, dass das Dehnungs-A, etwa in sagen, ‚verdunkelt‘ erscheint, was fak- 
tisch einem Übergang von ‚reinem‘ [a] hin zu einem [>]-ähnlichen Laut entspricht. 
Ebenso erscheint z.B. im Frankfurterischen der auf germanisches E in Dehnung 
zurückgehende Laut offen, also eher als ein [e:], weniger als das [e:] der hoch- 
deutschen Entsprechungen. Folglich muss ein gleitendes Merkmal zur Messung der 
Öffnungsstufe aufgesetzt werden. Klassifikatoren arbeiten umso besser, desto klarer 
die Trennlinien verlaufen und desto weniger ‚irrelevante‘ Datensätze zu berücksich- 
tigen sind. Im Frankfurterischen finden sich Verschiebungen in der Öffnungsstufe 
im Vergleich zum Hochdeutschen, doch sind die Unterschiede jeweils innerhalb der 
Untergruppe der ungerundeten Vorderzungenvokale bzw. der Hinterzungenvokale 
zu finden. Also bietet es sich an, jeweils ein gleitendes Merkmal für die Gruppe 


Rahmen des VOKALJÄGERs keine brauchbaren Ergebnisse und wurde nicht weiter verfolgt. Der 
Grund liegt an der Mischung aus linearer und quantal-stufenförmiger Wahrscheinlichkeitsfunk- 
tion beim Übergang zwischen den Elementarausprägungen, wie gut in Abbildung 69 auf S.174 
zu erkennen ist. Anstatt das Ensemble aus Binärmerkmalen zu konstruieren, wäre es auch mög- 
lich gewesen, diskrete Klassifikatoren zu verwenden, die direkt die Elementarausprägungen des 
Merkmals schätzen. Doch erwiesen sich mathematische Klassifikatoren mit binärer Antwort als 
flexibler im Experiment. 
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Elementarausprägungen der Öffnungsstufe der 
Hinterzungenvokale (m; =1, 2, 3, 4) 


primäre Stützlaute — |: 


gleitendes Merkmal der 
Öffnungsstufe der 
Hinterzungenvokale 

(Beispiel: Wert {= 3,4) 


FEN 


sekundäre 
Stützlaute 


gleitendes Merkmal des Rundungsgrads 
der Vorderzungenvokale (Beispiel: Wert 
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l.b. Öffnungsstufe Vorderzungenvokale Il. Rundungsgrad Vorderzungenvokale 


Abbildung 77: Definition der im VOKALJÄGER verwendeten gleitenden Merkmale 
der Öffnungsstufe (I.a) der Hinterzungenvokale und (I.b) der Vorderzungenvokale; 
sowie (II) des Entrundungsgrad der Vorderzungenvokale. Gezeigt sind jeweils die 


Elementarausprägungen als auch die zugeordneten primären und sekundären Stütz- 
laute. 
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Iir/er/e/a:] sowie die Gruppe [u:/o:/>/a:] zu schaffen. In beiden Fällen sind die 
Elementarausprägungen 1, 2, 3 und 4 bzw. geschlossen, halbgeschlossen, halboffen 
und offen. Das ist in Abbildung 77 auf S. 196 dargestellt und in Tabelle 21 auf 
S.198 vollständig dokumentiert. 

Die primären Stützlaute für die Elementarausprägungen sind schnell gefunden: 
es sind die eben benannten Vorderzungen- und Hinterzungenvokale. Im Lauf der 
Untersuchung zeigte es sich, dass im dialektalen Tonmaterial bei einzelnen Spre- 
chern — zumindest formanttechnisch — [a]-Realisierungen gefunden wurden, die 
eher im zentralen Bereich des hochdeutschen [e] liegen. Da allerdings der für das 
Frankfurterisch maßgebliche Kontrast [a] zu [5] und nicht [a] zu fe] ist, wurde im 
VOKALJÄGER der Fokus auf den Unterschied zwischen der Gruppe [a/e] und [>] 
gesetzt. Dazu bildet [a/e] die ‚verallgemeinerte‘ Öffnungsstufe 4, mit [e] als se- 
kundärem Stützlaut, die mit der Öffnungsstufe 3 bzw. [5] im Kontrast steht. Der 
sekundäre Stützlaut [o] ist rein technisch eine Begrenzung des [e] hin zu geschlosse- 
nen Stellungen. Da sowohl [e] als auch [o] sehr stark streuen und der beschriebene 
Effekt nachrangig und vereinzelt auftritt, wurden [o] bei der Konstruktion der Bi- 
närmerkmale separat von [a:/>/o:/u:] bzw. [ir/er/e/a:] angesetzt (vgl. Abschnitt 
5.3.3 ab S.197). Der sekundäre Stützlaut [e] im gleitenden Merkmal der Hinter- 
zungenvokale bzw. [5] für die Vorderzungenvokale hat ebenfalls rein technischen 
Charakter: er ‚schließt‘ [a] zur Seite hin ab. 


5.3.2.2 Gleitendes Merkmal Rundung 


Das andere prägende vokalische Muster des Frankfurterischen ist die fehlende Run- 
dung bzw. Entrundung bei Vorderzungenvokalen. Wo das Hochdeutsche [y:/o:/ce] 
hat, erscheint im Frankfurterischen ungerundetes bzw. entrundetes [i:/e:/e]. Die 
Konstruktion des gleitenden Merkmals der Rundung der Vorderzungenvokale ist 
einfach und ebenfalls in Abbildung 77 auf S. 196 dargestellt. Die Elementarausprä- 
gung ist 1 für die gerundeten Vorderzungenvokale mit den Stützlauten [y:/e:/ce] 
sowie 2 für die ungerundeten bzw. entrundeten Vorderzungenvokale mit den Stütz- 
lauten [ir/e:/e]”?. Da die Kontraste des Frankfurterischen innerhalb der Vorderzun- 
genvokale vorliegen, werden die gerundeten Hinterzungenvokale [u:/o:/5] hier nicht 
als Stützlaute herangezogen. 


5.3.3 Die Stütz- und Kontrastlaute sowie Binärmerkmale 


Die Binärmerkmale sind die von den Klassifikatoren mathematisch zu schätzenden 
Merkmale. Inhaltlich sind sie im VOKALJÄGER an bestimmte Elementarausprä- 
gungen gebunden. Diese wiederum ergeben sich aus dem zugrundeliegenden glei- 
tenden Merkmal (vgl. Abschnitt 5.3.2 ab S. 195). Tabelle 21 auf S.198 führt alle 


72Die Verwendung der unüblich erscheinenden Zahlenwerte 1 und 2 anstatt etwa 0 und 1 ist 
rein technisch bedingt und hat keinerlei inhaltliche Bedeutung: Der Wert 0 wird vermieden und 
der niedrigste Zahlenwert des gleitenden Merkmals der Rundung, die 1, ist nun im VOKALJÄGER 
technisch gleich dem niedrigsten Wert des gleitenden Merkmals der Öffnungsstufe. 
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Binärmerkmale des VOKALJÄGERSs sowie ihre Zuweisung auf bestimmte gleitende 
Merkmale als auch die Stütz- und Kontrastlaute auf. In ihrer endgültigen Gestalt 
sind sie das Ergebnis struktureller Erwägungen sowie Erfahrungen aus Klassifika- 
tionsexperimenten mit dem VOKALJÄGER (vgl. Abschnitt 6 ab $. 215). 

Strukturell gibt es drei Typen von Binärmerkmalen. Die erste Gruppe umfasst 
Binärmerkmale, die eineindeutigen Bezug zu Einzellauten haben: Das Binärmerk- 
mal testet, ob die unbekannte Lautprobe dem einen Stützlaut ähnlich ist oder 
nicht. Ein Beispiel ist das Binärmerkmal M-oo, was auf der einen Seite eineindeu- 
tig an den Stützlaut [o:] gebunden ist”?. Auf der anderen Seite ist M-oo ebenso 
eineindeutig an die Elementarausprägung 2 der Öffnungsstufe der Hinterzungen- 
vokale gebunden. Entsprechend testet M-oo auf Vorliegen bzw. Nicht-Vorliegen 
der Öffnungsstufe 2 (in mathematischer Schreibweise 2 | =2; vgl. auch Abbildung 
68 auf S.172). M-E, der Test auf [e], wird z.B. sowohl für das gleitende Merk- 
mal der Öffnungsstufe der Vorderzungen- als auch Hinterzungenvokale herange- 
zogen, jeweils für die gleiche Elementarausprägung 3. Die Zahl der Kontrastlaute 
ist bewusst so stark wie möglich eingeschränkt: Nur Laute, die klassifikations- 
wie messphonetisch ‚nahe‘ sind, werden angesetzt. Dies dient der Optimierung der 
mathematischen Klassifikation, um diese nicht mit Kontrastlauten-Kandidaten zu 
‚überfrachten‘, die faktisch nie in direkter Opposition zu dem Stützlaut stehen’*. 

Die zweite Gruppe betrifft die an die Zentralvokale [e/o] jeweils einzeln gebun- 
denen Binärmerkmale M-6, M-@HZ, und M-@VZ. M-6 bzw. [e] ist ebenso wie M-aa 
bzw. [a:] an die Öffnungsstufe 4 gebunden und steht für einen verallgemeinerten 
A-Laut, der mit [5] bzw. M-O in Kontrast tritt (vgl. S.197 für weitere Erläuterun- 
gen). Das hier als Stützlaut angesetzte [e] soll Repräsentant für einen betonten 
A-ähnlichen Laut sein, obwohl es im Hochdeutschen regelmäßig nur unbetont vor- 
kommt. Das Problem wird umgangen, indem beim Training nur [e]-Lautproben 
als repräsentativ ausgewählt werden, die Energiedichten haben, die mit betonten 
Lauten vergleichbar sind’”®. Um eine unerwünschte Beeinflussung durch diese rein 
sekundären Stützlaute zu vermeiden, sind sie durch Kontrastlaute ‚eingerahmt‘, 
die allesamt primäre Stützlaute sind. Sie sind auch streng getrennt: So sind sie 
nicht als Kontrastlaute in anderen Binärmerkmalen angesetzt. M-@VZ und M-@HZ 
sind jeweils für Vorderzungen- und Hinterzungenvokale angepasste Konstellationen 
für den [o] Laut, die sich durch die Wahl der Kontrastlaute unterscheiden. 

Die letzte Gruppe sind Binärmerkmale, die auf Lautgruppen von Stützlauten 
aufsetzen. Hier sind M-RndFrnt und M-nRndFrnt Binärmerkmale zur Markierung 
der Rundung bzw. Entrundung der Vorderzungenvokale. 


73Die Benennung der Binärmerkmale folgt grob den SAMPA-Codes aus Tabelle 2 auf S.21, 
hier ‚o‘ für [o]. Der Textsatz in Schreibmaschinenschrift soll den technischen Charakter anzeigen 
und Verwechslungen vorbeugen. 

74Damit wird auch das Ungleichgewicht zwischen Positiv- und Negativproben beim Training 
der Klassifikatoren reduziert (vgl. Abschnitt 5.4.5 ab S.208). 

75Technisch werden die Lautproben dergestalt bestimmt, dass die mittlere Intensität gemäß 
Formel (10) von S.73 nach MAD-Normalisierung (vgl. Abschnitt 3.6.6 ab S.91) untersucht wird. 
Nur Werte mit einem Z > 0,5 werden verwendet, was etwa 27% aller [e] entspricht. 
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5.3.4 Die Prädiktorvariablensätze 


Mathematische Klassifikatoren, die die Binärmerkmale aus Abschnitt 5.3.3, S. 197 £., 
zu bestimmen suchen bzw. die Formel (35) von $.171 zugrundeliegende Wahr- 
scheinlichkeit p;(x) der i-ten Elementarausprägung errechnen, basieren auf einem 
Datensatz x akustischer Größen. Dieser Datensatz x muss notwendig repräsentativ 
für das Binärmerkmal sein. Prinzipiell kann jede beliebige Auswahl und Kombi- 
nation der akustischen Größen aus Kapitel 3, S.35f., als Datensatz x angesetzt 
werden, doch nur manche erweisen sich endgültig als brauchbar. Tabelle 22 auf 
S.201 führt die im VOKALJÄGER getesteten Variablensätze auf”®. 


5.3.5 Die mathematischen Schätzermodelle 


Die Aufgabe des mathematischen Schätzermodells im VOKALJÄGER ist es, im Bi- 
närklassifikator zu entscheiden, ob bzw. mit welcher Wahrscheinlichkeit eine Ele- 
mentarausprägung eines Merkmals in einer Lautprobe vorliegt. Die Beurteilung 
erfolgt aufgrund eines Satzes von Prädiktorvariablen. Eine beispielhafte Nutzung 
eines Schätzermodells wäre also, die Wahrscheinlichkeit zu errechnen, dass, gege- 
ben die ersten drei Formanten als Prädiktorvariablen, die Ausprägung ‚offen‘ bzw. 
Öffnungsstufe 4 oder eben [a:] vorliegt. 

Zur mathematischen Klassifikation existiert eine Vielzahl von Methoden und 
Algorithmen. Hier soll nur ein konzeptioneller Überblick über die Schätzermo- 
delle gegeben werden, die im VOKALJÄGER getestet wurden (vgl. Tabelle 23 auf 
S.202). Auch wird auf eine exakte mathematische Beschreibung verzichtet - dazu 
sei auf die angegebene Fachliteratur verwiesen. Dieser Abschnitt kann gegebenen- 
falls übersprungen werden und soll nur als Referenz dienen. 

Den einzelnen Kurzprofilen sind Informationen nachgestellt, die über die exak- 
te Implementierung der Algorithmik im VOKALJÄGER Auskunft geben. Manche 
der Algorithmen können über Stellwerte kalibriert werden. Der optimale Stellwert 
wird in der Regel empirisch durch Ausprobieren im Trainingsschritt im sogenann- 
ten tuning bestimmt (vgl. Abschnitt 5.4 auf S. 206). Die Schätzermodelle nutzen 
ausgewählte Prädiktorvariablen aus Tabelle 22 auf S.201 als Eingabe. Im Re- 
gelfall sind diese das Ergebnis einer Normalisierung und damit im Wertebereich 
untereinander vergleichbar (vgl. Abschnitt 3.6 auf S. 84). Dies ist die für manche 
Schätzermodelle unbedingt notwendige Grundvoraussetzung. 


5.3.5.1 Linear Discriminant-Analysis (LDA) 


Die Algorithmen der Diskriminanzanalyse, discriminant analysis, bilden die ers- 
te Gruppe von Algorithmen, die beschrieben werden sollen (Kuhn/ Johnson 2013, 
287-297 und 329-332). Der Grundgedanke dieses Typs von Algorithmen ist es, 
einen Schnitt durch die Daten derart durchzuführen, dass idealerweise auf der 


76 Analog zu den Binärmerkmalen werden die technischen Bezeichnungen der Prädiktorvaria- 
blensätze in Schreibmaschinenschrift gesetzt und mit einem führenden V- versehen. 
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Code Schätzermodell Abk. 
S-1da Linear Discriminant-Analysis LDA 
S-qda Quadratic Discriminant-Analysis QDA 
S-rda Regularized Discriminant-Analysis RDA 
S-mda Mixture-Discriminant-Analysis MDA 
S-nnet Neuronal Network NNET 
S-svmRadial Radial Support-Vector-Machine SVM 
S-knn k-Nearest Neighbors KNN 
S-nb Naive Bayes NB 
S-rf Random Forest RF 


Tabelle 23: Die mathematischen Schätzermodelle, die im VOKALJÄGER zum Ein- 
satz kommen (Code: Technischer Bezeichner. Abk.: Übliche Abkürzung). 


einen Seite die Datenpunkte liegen, für die die Elementarausprägung vorliegt (z.B. 
die Öffnungsstufe ist ‚offen‘: Klasse 1), und auf der anderen Seite die Datenpunkte 
liegen, für die die Elementarausprägung nicht vorliegt (z.B. die Öffnungsstufe ist 
nicht ‚offen‘, sondern eben ‚halboffen, halbgeschlossen‘ oder ‚geschlossen‘: Klasse 
2). Im VOKALJÄGER gibt es nur genau einen Schnitt bzw. nur zwei Klassen — das 
Problem ist binär. Mathematisch-technisch werden dabei die Daten so transfor- 
miert, dass man Wahrscheinlichkeitsfunktionen angeben kann, welche die Daten 
in den beiden Klassen jeweils besonders gut beschreiben, insbesondere so, dass 
diese wenig überlappen. 

Die lineare Diskriminanzanalyse, linear diseriminant analysis (LDA), im VO- 
KALJÄGER: S-1da, ist von der Idee her ein älteres Modell (Fisher [1936] und 
Welch [1939]). Die LDA nimmt an, dass der Schnitt durch die Daten linear ist, 
also eine Gerade bildet bzw. in einem höherdimensionalen Raum eine Hyperebe- 
ne darstellt (analog: die Datentransformation, um den Schnitt durchzuführen, ist 
eine Linearkombination). Mathematisch ist diese Annahme gleichbedeutend mit 
der Forderung, dass man die Daten pro Klasse mit Wahrscheinlichkeitsfunktionen 
beschreiben kann, die zwar unterschiedliche Mittelwerte haben (also an unter- 
schiedlichen Stellen im Raum liegen), aber allesamt dieselbe Kovarianzstruktur 
aufweisen (also gleichartig streuen). Gerne wird als Wahrscheinlichkeitsfunktion 
die Normalverteilung angesetzt. 

Im VOKALJÄGER wird das Modul Ida aus dem R-Paket MASS verwendet (Ri- 
pley 2015a). Die LDA hat keine Stellwerte. 


5.3.5.2 Quadratic Discriminant-Analysis (QDA) 


Die quadratische Diskriminanzanalyse, quadratic discriminant analysis (QDA), im 
VOKALJÄGER S-qda, lässt die Anforderung, dass alle Klassen die identische Ko- 
varianzstruktur haben müssen, fallen. Dies ist gleichbedeutend damit, dass der 
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Schnitt nun keine Gerade bzw. Hyperebene mehr sein muss, sondern eine geboge- 
ne, parabolische Fläche sein kann. 

Im VOKALJÄGER wird das Modul qda aus dem R-Paket MASS verwendet (Ri- 
pley 2015a). Die QDA hat keine Stellwerte. 


5.3.5.3 Regularized Discriminant-Analysis (RDA) 


Mit der normalisierten Diskriminanzanalyse, regularized discriminant analysis 
(RDA), im VOKALJÄGER S-rda, ging Friedman (1989) einen Schritt weiter: der 
Schnitt kann nun eine Mischung aus linearer Hyperebene und gebogener, parabo- 
lischer Fläche sein. Mathematisch-technisch ist die endgültige Kovarianzstruktur 
nun eine Mischung aus der einen klassenübergreifenden Kovarianz und den indivi- 
duellen Kovarianzen pro Klasse. 

Im VOKALJÄGER wird das Modul rda aus dem R-Paket klaR verwendet (Roever 
u.a. 2014). Der Stellwert der RDA ist das Mischverhältnis. Für den VOKALJÄGER 
kann es Werte von O0 bis 1 in Schritten von 0,25 annehmen und wird empirisch 
optimal bestimmt. 


5.3.5.4 Mixture-Discriminant-Analysis (MDA) 


Eine alternative Erweiterung, die gemischte Diskriminanzanalyse, mixture discri- 
minant analysis (MDA), im VOKALJÄGER S-mda, wurde von Hastie/Tibshirani 
(1996) vorgeschlagen: Während die LDA nur genau eine Wahrscheinlichkeitsfunk- 
tion pro Klasse zulässt, erlaubt die MDA nun mehrere. Eine Klasse wird durch 
eine Serie von Unterklassen, jede mit ihrer eigenen Wahrscheinlichkeitsfunktion, 
modelliert. Obwohl die Einschränkungen der LDA gelten, also nur eine Kovari- 
anzstruktur vorliegt und Approximation durch Normalverteilungen durchgeführt 
wird, ist mit der MDA eine Abbildung der Feinstrukturen und damit eine verbes- 
serte Leistung möglich. Durch die Normalverteilungen ergibt sich ein harmonisches 
Verhalten, insbesondere in den Randbereichen sowie die Möglichkeit einfacher und 
direkter Wahrscheinlichkeitsberechnungen, was sich im VOKALJÄGER von Vorteil 
erweist. 

Im VOKALJÄGER wird das R-Paket mda verwendet (Leisch u. a. 2013). Die An- 
zahl der möglichen Unterklassen ist der Stellwert der MDA. Für den VOKALJÄGER 
liegt die Anzahl zwischen 1 und 20 und wird empirisch optimal bestimmt. 


5.3.5.5 Neuronal Network (NNET) 


Neuronale Netzwerke, neuronal networks (NNET), im VOKALJÄGER S-nnet, eig- 
nen sich ebenfalls zur mathematischen Klassifikation (Bishop [1995], Ripley [1996] 
und Kuhn/Johnson [2013, 141-151 und 333-33]). Die Kernidee ist es, die Prä- 
diktorvariablen zusammenzuführen und dann, basierend auf dem Ergebnis dieses 
Zusammenmischens, ähnlich einem Neuron im Gehirn, zu ‚schalten‘ oder nicht. Ma- 
thematisch-technisch ist das Zusammenführen eine Linearkombination, das ‚Schal- 
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ten‘ das Anwenden der sogenannten Sigmoid-Funktion und das Neuron die hidden 
unit. Ein übliches neuronales Netz vereinigt, ebenfalls an das Gehirn angelehnt, 
eine Vielzahl dieser Hidden Units. Neuronale Netze tendieren dazu, sich an das 
Referenzmaterial stark anzupassen und dann in der Nutzanwendung Leistungsein- 
brüche aufzuweisen. Eine übliche Methode, das zu korrigieren, ist es, sogenannten 
weight decay einzuführen: sollten Prädiktorvariablen zu stark dominieren, ohne 
signifikant zur Verbesserung der Klassifikationsleistung beizutragen, werden sie 
untergewichtet. 

Im VOKALJÄGER wird das R-Paket nnet verwendet (Ripley 2015b). Die Anzahl 
der Hidden Units als auch der Wert des Weight-Decay sind die Stellwerte des 
neuronalen Netzes. Im VOKALJÄGER werden 1, 2, 5 und 10 Hidden Units und 
Gewichtswerte von 0, 1 und 2 sowie 0,1 zugelassen und die optimale Kombination 
wird empirisch bestimmt. 


5.3.5.6 Support-Vector-Machine (SVM) 


Die Stützvektormaschine, support vector machine (SVM) setzt ähnlich der Dis- 
kriminanzanalyse an: Wie kann man einen Schnitt durch die Daten führen, so 
dass die Klassen ideal getrennt werden (Boser u.a. [1992], Vapnik [1995] und 
Kuhn/Johnson [2013, 151-159 und 343-350]). In einer SVM wird algorithmisch 
nach dem Schnitt gesucht, der die höchste Trennschärfe zwischen den Klassen hat 
— die SVM ist ein maximum margin classifier. Mathematisch-technisch wird der 
Schnitt, eine Hyperebene, genau durch die Datenpunkte definiert, die dem Schnitt 
am nächsten liegen. Diese Datenpunkte definieren die Stützvektoren, support vec- 
tors, die wiederum die trennende Ebene definieren. Der Schnitt ergibt sich nach 
einer mathematischen Transformation der Daten. In der im VOKALJÄGER zum 
Einsatz kommenden Version der SVM ist diese durch eine sogenannte radiale Ba- 
sisfunktion gegeben - entsprechend ist das Schätzermodell im VOKALJÄGER mit 
S-svmRadial bezeichnet. 

Im VOKALJÄGER wird das R-Paket kernlab verwendet (Karatzoglou u.a. 2015). 
Auf Variation von Stellwerten wurde verzichtet. 


5.3.5.7. K-Nearest Neighbors (KNN) 


Eine konzeptionell sehr einfache, aber doch sehr leistungsstarke Methode ist die 
der k-Nachbarn, k-nearest neighbors (KNN), im VOKALJÄGER S-knn (Liu [2006] 
und Kuhn/Johnson [2013, 159-161 und 350-352]). Die Kernidee ist, dass die Wahr- 
scheinlichkeit, dass die Probe einer bestimmten Klasse angehört, umso größer ist, 
desto mehr Proben in der Nachbarschaft dieser Klasse angehören. Das Ergebnis 
dieser Methode hängt maßgeblich davon ab, wie man ‚Nachbarschaft‘ definiert 
bzw. welche Abstandsmetrik angesetzt wird und wie viele Nachbarn man in der 
Berechnung berücksichtigen möchte. 

Im VOKALJÄGER wird das Modul knn aus dem R-Paket class verwendet, das 
eine euklidische Distanzmetrik verwendet (Ripley/Venables 2015). Als Stellwert 
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gilt die Anzahl der Nachbarn, die im VOKALJÄGER Werte von 5, 10 usw. bis 25 
annehmen kann. Die optimale Anzahl wird empirisch bestimmt. 


5.3.5.8 Naive Bayes (NB) 


Die Methode, die üblicherweise Naive Bayes (NB) benannt wird, im VOKALJÄGER 
S-nb, ist ein weiterer radikal einfacher, eben fast ‚naiver‘, Ansatz, der aber über- 
raschenderweise sehr gute Ergebnisse erzielt (Kuhn/ Johnson 2013, 353-358). In 
dieser Methode wird direkt aus gemessenen Häufigkeiten einer Referenz die Wahr- 
scheinlichkeit errechnet, dass in einer unbekannten Probe eine bestimmte Klasse 
vorliegt -— wenn z.B. der Formant diesen oder jenen Wert hat, wie wahrschein- 
lich ist es dann, dass die Öffnungsstufe ‚offen‘ ist? Was den Ansatz technisch so 
einfach macht, ist zum einen, dass nur Häufigkeiten ausgezählt werden, aber kei- 
nerlei Verteilungsannahmen getroffen werden. Zum anderen wird angesetzt, dass 
die einzelnen Prädiktorvariablen unabhängig voneinander sind. Dies ist zwar in der 
Realität fast nie der Fall, schränkt aber faktisch oft die Leistungsfähigkeit nicht 
ein. 

Im VOKALJÄGER wird das Modul nb aus dem R-Paket klaR verwendet (Roever 
u.a. 2014). Auf Variation von Stellwerten wurde verzichtet. 


5.3.5.9 Random Forest (RF) 


In einem sogenannten Klassifikationsbaum, classification tree, wird, vom ‚Stamm‘ 
ausgehend, über eine Folge von Tests auf die Prädiktorvariablen - an jedem ‚Ast- 
knoten‘ - ein ‚Entscheidungspfad‘ abgelaufen, der vom ‚Stamm‘ zum ‚Blatt‘ am 
Ende der ‚Äste‘ führt. Hat man das ‚Blatt‘ erreicht, ist die Entscheidung getroffen, 
welcher Klasse die Probe angehört. Klassifikationsbäume funktionieren tendenziell 
gut, weisen aber das Risiko auf, sich zu sehr an die Trainingsreferenz zu adaptie- 
ren und in der Anwendung zu versagen. Diese Problematik versucht man dadurch 
zu überwinden, dass man einen ‚Wald‘ von zufällig ausgewählten Klassifikations- 
bäumen verwendet, die untereinander die negativen Effekte korrigieren. Dies ist 
die junge und leistungsstarke Methode des random forest (RF), im VOKALJÄ- 
GER S-rf (Breiman [1996], Breiman [2001] und Kuhn/Johnson [2013, 173-203 
und 369-389]). 

Im VOKALJÄGER wird das R-Paket randomForest verwendet (Liaw/Wiener 
2014). Auf Variation von Stellwerten wurde verzichtet. 
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5.4 Das Training der Klassifikatoren 


5.4.1 Technische Vorbemerkungen: CARET 


Der Rechenkern des VOKALJÄGERS für die Klassifikationsphonetik ist in der Sta- 
tistik Software R implementiert. Für mathematische Klassifikation wird das R- 
Paket CARET, was eine Abkürzung für classification and regression training ist, 
genutzt (Kuhn/Johnson [2013] und Kuhn [2015]). Dieses erlaubt, die Vielheit der 
Schätzermodelle aus Abschnitt 5.3.5, S. 200f., in ihrer jeweiligen R-Implementie- 
rung über eine standardisierte R-Schnittstelle anzusprechen. Insbesondere bietet 
CARET auch die Möglichkeit, die optimalen Stellwerte der Schätzermodelle au- 
tomatisch zu bestimmen. Bevor der Klassifikationkern in CARE Tausgeführt wird, 
laufen die entsprechenden Vorbereitungsschritte, insbesondere die ganze spezifische 
Messphonetik aus Kapitel 3, S. 35 f. Sich anschließende Schritte sind zum einen die 
Berechnung der gleitenden Merkmale aus Abschnitt 5.3, S. 192f., als auch nachbe- 
reitende Berechnungen, wie vor allem die Nach-Kalibrierung, die weiter unten ab 
Abschnitt 5.4.5 ab S. 208 erläutert wird. 

Die im VOKALJÄGER letztendlich exakt zum Einsatz kommende Kombinati- 
on aus gleitenden Merkmalen, Prädiktorvariablen und Schätzermodellen wird in 
Abschnitt 6.2 ab S. 226 vorgestellt — als Ergebnis der individuellen Praxistests. 


5.4.2 Ansatz 


Im Training ‚lernt‘ der Klassifikator aus der Trainingsmenge HG1, das Binärmerk- 
mal korrekt zu schätzen: auf die Stützlaute des Binärmerkmals soll der Binärklas- 
sifikator positiv reagieren, auf die Kontrastlaute negativ. In der Kontrolle mit der 
unabhängigen Gruppe HG2 ermittelt der Klassifikator das Merkmal selbstständig, 
aber die korrekte originale Merkmalsausprägung ist bekannt. Im Nutzeinsatz des 
Klassifikators ist das Merkmal unbekannt. Man ‚verlässt‘ sich dann auf die Güte 
des Klassifikators. Dieser Abschnitt beschreibt konzeptionell das Vorgehen beim 
Training des VOKALJÄGERS. Die Ergebnisse werden dann in Kapitel 6 ab S. 215 
vorgestellt und diskutiert. 

Zur Beurteilung der Schätzgüte eines Klassifikators gibt es eine Vielzahl von 
Methoden, deren Auswahl subjektiv ist und auf die geplante Nutzanwendung hin 
ausgerichtet sein muss. Das einfache Maß des Schätzfehlers, also die Rate der falsch 
klassifizierten Laute, wäre nur bei ausbalancierter Verteilung der Stütz- und Kon- 
trastlaute sinnvoll. Das ist aber nicht der Fall. Die übliche Alternative, die auch im 
VOKALJÄGER genutzt wird, ist der um das Ungleichgewicht korrigierte Schätzfeh- 
ler, Cohens Kappa (vgl. Abschnitt A.4.4 ab S. 451 zu den mathematischen Details). 
Doch nicht notwendigerweise ist ein an Kappa ausgerichteter Klassifikator für die 
phonetische Klassifikation im VOKALJÄGER direkt optimal. Das endgültige Güte- 
maß, der Kompromissfehler, verbessert den nach Kappa optimierten Klassifikator 
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dahingehend, dass ein bestimmter Ausgleich zwischen den Fehlern bei den Stütz- 
und den Kontrastlauten gesucht wird (vgl. Abschnitt 5.4.5 ab S. 208)”. 

Das Training soll nun im Folgenden beispielhaft an einem Binärklassifikator für 
das Binärmerkmal der Öffnungsstufe ‚halboffen‘ der Hinterzungenvokale erläutert 
werden. Dies ist faktisch ein Test auf das Vorliegen eines [5] bzw. die Anwendung 
des Binärmerkmals M-O (vgl. Tabelle 21 auf S. 198). Der Beispielklassifikator basiert 
hier aus Gründen der einfachen grafischen Darstellung nur auf den ersten beiden 
Formanten, also dem Prädiktorvariablensatz V-F12 (vgl. Tabelle 22 auf S. 201) und 
nutzt die S-mda als mathematisches Schätzermodell (vgl. Tabelle 23 auf S. 202). Für 
andere Binärmerkmale bzw. Klassifikatoren ist das Vorgehen völlig analog. 


5.4.3 Bestimmen der Trainingsmenge 


Im ersten Schritt werden 7.820 Vokalproben aus der Trainingsmenge HG1 in drei 
Gruppen aufgeteilt. Die erste Gruppe ist die der Stützlaute. Sie enthält 171 [>] 
Proben, die zu erkennen der Klassifikator trainiert werden soll und bildet die Po- 
sitivmenge. Technisch handelt es sich um alle Proben, die eine mit ‚e‘ angezeigte 
Positivmarkierung in Tabelle 21 auf S. 198 aufweisen. In der zweiten Gruppe be- 
finden sich die Kontrastlaute und bilden so die Negativmenge. Sie enthält hier 
1.361 Proben der Vokale [e/a:/o:], die der Klassifikator nicht als [5] zu erkennen 
trainiert werden soll. Die Kontrastlaute korrespondieren mit dem Symbol & in 
Tabelle 21. Es verbleiben 6.288 Vokalproben als Rest, die einer Neutralmenge zu- 
gewiesen werden. Diese Gruppe bleibt beim Training unberücksichtigt. Die Stütz- 
und Kontrastlaute bilden in diesem Beispiel zusammen die Trainingsmenge mit 
insgesamt 1.532 Proben. 


5.4.4 Trainieren des Schätzermodells mit Kreuz-Validierung 


Mit der Trainingsmenge wird im zweiten Schritt das Klassifikatortraining gest- 
artet, wobei für das jeweilige Schätzermodell spezifische Einstellungen angesetzt 
werden (vgl. Abschnitt 5.3.5 ab S.200). Im Training wird die Technik der wie- 
derholten k-fachen Kreuz-Validierung, repeated k-fold cross-validation, wie etwa 
in Kuhn/Johnson (2013, 69-70) beschrieben, angesetzt. Dazu wird die Trainings- 
menge in zehn Untermengen aufgeteilt und das Schätzermodell jeweils mit neun 
Untermengen trainiert. Der Test erfolgt dann mit der einen verbleibenden, was 
insgesamt zehn Durchläufe ergibt, also k = 10, wie auch in Kuhn/Johnson (2013, 
78) empfohlen. Mit diesem Ansatz werden automatisch und künstlich nicht über- 
lappende Untermengen zum Training und zum Testen geschaffen. Dieser Vorgang 
wird fünfmal wiederholt. Technisch findet der ganze Vorgang in R statt, basierend 


"7Ein weiteres Gütemaß ist die Trennschärfe. Hier wird einem Klassifikator — bei sonst iden- 
tischer Schätzgüte — der Vorzug gegeben, falls die Verteilungen der Schätzerantworten weniger 
überlappen als bei anderen Alternativen. Im VOKALJÄGER ergaben sich unter Anwendung dieses 
Kriteriums keine wesentlich andere Auswahl. 
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auf dem Paket CARET. In diesem ersten Schritt ist, so nicht anders angegeben, die 
zu optimierende Gütezielgröße Kappa. 

Im Ergebnis erhält man ein trainiertes Schätzermodell. Im Beispiel beträgt 
die originäre Kappa-Genauigkeit 0,73 + 0,08. Die relativ niedrige Kappa-Güte ist 
durch die statistische Streuung des [>] in den Bereich der [a:] und [o:] sowie die 
ungleichen Häufigkeiten bedingt (171 [>], 441 [az], 252 [or], 668 [e]). Damit zeichnet 
sowohl die niedrige originäre Kappa-Genauigkeit als auch die vermeintlich hohe 
nominale Erkennungsrate von 0,95 # 0,02 ein irreführendes Bild. Die Verwerfungen 
werden im nächsten Schritt korrigiert. 


5.4.5 Kalibrieren der Schaltschwelle: Der Kompromissfehler 


Im dritten Schritt wird das Modell rekalibriert, um Verzerrungen durch unter- 
schiedliche Populationen von Stütz- und Kontrastlauten auszugleichen und es für 
die Nutzung im VOKALJÄGER anzupassen. 

Das Schätzermodell errechnet mathematisch einen numerischen Wert ro. Die- 
ser ist die originäre Antwort, response, des Schätzermodells auf einen unbekannten 
Laut, repräsentiert durch bestimmte Prädiktorvariablen’®. Übersteigt ro für einen 
unbekannten Laut eine Schaltschwelle, cut-off, c, geht man davon aus, dass das 
Schätzermodell das Binärmerkmal in diesem Laut ‚erkannt‘ hat. Nicht notwen- 
digerweise ist die originäre Schätzerantwort eine Wahrscheinlichkeit im engeren 
Sinne, so etwa bei neuronalen Netzwerken. Wohl aber ist der numerische Zah- 
lenwert der Schätzerantwort umso größer, desto mehr das Schätzermodell eine 
bestimme Ausprägung favorisiert. Das hier übliche Vorgehen ist das Transformie- 
ren solcher Werte in wahrscheinlichkeitsähnliche Maße, etwa mit einer sogenann- 
ten softmaz transformation (Zhang/Ma [2012, 8] und Kuhn/ Johnson [2013, 248]). 
Eine andere Möglichkeit ist mit Garczarek (2002) eine Transformation mit der 
Beta-Verteilung. Der VOKALJÄGER verwendet ausschließlich R-Schätzermodelle 
über das CARET-Paket. Hier besteht für die meisten Modelle die Möglichkeit, sich 
Pseudowahrscheinlichkeiten im Bereich von O bis 1 errechnen zu lassen, was auch 
entsprechend genutzt wird. Für solche Pseudowahrscheinlichkeiten wird initial ei- 
ne Schaltschwelle von co = 0,5 angenommen. Doch ist der Wert cg = 0,5 gerade 
bei großem Ungleichgewicht zwischen Positiv- und Negativmenge bzw. Stütz- und 
Kontrastlauten fragwürdig (Kuhn /Johnson 2013, 423£.). Diese Situation ist in Ab- 
bildung 78 auf S. 209 exemplarisch dargestellt. 

Die absolute Anzahl von Fehlklassifikationen eines bestimmten Lauts ist irre- 
levant, da sie maßgeblich von der Anzahl der Lautproben dieses Lauts abhängt. 
Die Anzahl der Lautproben pro Laut als auch die Gesamtzahl der Laute jeweils 
in der Positiv- und der Negativmenge ist vom ausgewähltem Trainingsmaterial 
bestimmt und wird sich in der Test- oder Nutzanwendung so nicht wiederfinden. 
Entsprechend setzt der VOKALJÄGER auf einem korrigierten relativen Fehlermaß 


78Ejn alternativer Begriff ist ‚Unterstützung‘, support, des Schätzermodells für die Hypothese, 
dass ein bestimmtes Merkmal vorliegt. 
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Abbildung 78: Originäre Pseudowahrscheinlichkeit bzw. Schätzerantwort ro (y- 
Achse) für Lautproben aus HGl, dargestellt in einem Boxplot. Angesetzt ist ein 
Klassifikator für das Binärmerkmal M-0, mit den Prädiktorvariablen V-F12 und dem 
Schätzermodell S-mda. Hohe ro-Werte, tendenziell zur 1 hin, zeigen, dass dieser Klas- 
sifikator den Laut als [5] einschätzt; niedrige ro-Werte, tendenziell zur O hin, lassen 
vermuten, dass kein [5] vorliegt. Die Laute sind von links nach rechts in Gruppen 
angeordnet: Die Laute [o/o:/e/oe/a/er/e:/ı/ir/u/ur/v/y:] der Neutralmenge werden 
beim Training nicht berücksichtigt, wohl aber liegen Antworten des Schätzers vor; 
für die Kontrastlaute [a:/e/o:] ist eine trainierte Ablehnung durch den Schätzer, also 
niedrige ro, zu erwarten; für den Stützlaut [>] ist eine trainierte Akzeptanz durch den 
Schätzer, also hohe ro, zu erwarten. Deutlich ist das gewünschte Verhalten zu erken- 
nen. Aber der Schwellenwert c, der bestimmt, ab welchem ro wohl ein [5] vorliegt, 
liegt nicht bei dem etwas zu hohen co = 0,5 (gestrichelte Linie), sondern darunter. 
Die empirisch rekalibrierte Schwelle findet sich dann bei 0,33 (durchgezogene Linie). 
Deutlich sind Muster zu erkennen, die das Verhalten des VOKALJÄGERS in der Nutz- 
anwendung vorwegnehmen. So geht etwa [a] dem [a:] gleich, obwohl der Schätzer nie 
auf [a] trainiert wurde. 
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auf. Zum einen wird die relative Fehlerrate eines jeden Lauts angesetzt und nicht 
die absolute Fehlerzahl, was unterschiedliche Lauthäufigkeiten ausgleicht. Zum an- 
deren werden Stütz- und Kontrastlaute in ihrer Gesamtheit jeweils gleich stark 
gewichtet, was die unterschiedliche Anzahl von Lauten pro Menge nivelliert. 

Mathematisch wird nun wie folgt vorgegangen: Es wird das Binärmerkmal bei 
einer Lautprobe als vorhanden angesetzt, falls die originäre Pseudowahrschein- 
lichkeit des Schätzers ro bei dieser Lautprobe über einer beliebigen, aber fixen 
Schaltschwelle c liegt. Es kommt dann zu einer Fehlklassifikation erster Art, falls 
das Binärmerkmal vorliegt, aber rg < c und zu einer Fehlklassifikation zweiter Art, 
falls das Binärmerkmal nicht vorliegt, aber ro > c. Hinsichtlich der Kontrastlau- 
te wird eine zu niedrige Schwelle ce zu Fehlern führen, da zwar durchaus niedrige 
Antwortwerte ro erwartet werden, aber eben nicht nur sehr niedrige. Für z.B. Ja:] 
und [o:], den Nachbarlauten von [5], ist dies gut in Abbildung 78 auf S.209 zu 
erkennen, wo die Schätzerantwort leicht von O0 abweicht. Entsprechend wird eine 
zu hohe Schwelle c zu Fehlklassifikationen bei Stützlauten führen, da reale Ant- 
wortwerte trotz Vorliegen des Binärmerkmals sehr deutlich unter dem Wert von 1 
liegen: Im Beispiel findet sich der Median der Stützlaute numerisch unterhalb von 
0,5. 

Für den VOKALJÄGER wurde ein Algorithmus implementiert, der die optimale 
Schaltschwelle c* und somit einen optimalen Fehler &* = e(c*) insofern bestimmt, 
als dass ein Ausgleich zwischen dem maximalen Fehler e*(c) bei den Stützlauten 
und dem maximalen Fehler e”(c) bei den Kontrastlauten gefunden wird. Dieser 
Kompromissfehler ist das endgültige Gütemaß des Binärklassifikators. Der Kom- 
promissfehler ist ein maximaler Fehler und adaptiert sich als konservatives Maß 
jeweils an den einen Laut aus den Stütz- und Kontrastlauten, bei dem die Klassi- 
fikation am schlechtesten funktioniert. Die exakten Rechenschritte finden sich im 
Anhang A.4.5 ab S. 452. 

Im Beispiel verringert sich der maximale Fehler der Stützlaute, hier: [5], von 
20% auf & = 15% beim Wechsel von der originalen Schaltschwelle co = 0,50 auf 
die optimale Schaltschwelle c* = 0,33. Dies geschieht auf Kosten der Kontrastlaute, 
deren maximaler Fehler pro Laut von 10% auf e* = 15% ansteigt. Das Vorgehen 
ist in Abbildung 79 auf S. 211 erläutert. Die optimale Schwelle c<* = 0,33 ist auch 
in Abbildung 78 auf S. 209 eingezeichnet. 


5.4.6 Rekalibrierung der Pseudowahrscheinlichkeiten 


Die originären Pseudowahrscheinlichkeiten r; müssen abschließend in einem mehr- 
stufigen Prozess reskaliert werden, unter anderem mit Nutzung der optimalen 
Schaltschwelle aus dem vorherigen Abschnitt. Nur dann haben sie den gewünsch- 
ten Charakter einer nutzbaren ‚Wahrscheinlichkeit‘ bzw. nur so können sie als 
numerisches Gewicht p; in den Erwartungswert des gleitenden Merkmals eingehen 
aus Formel (35) von $.171. An dieser Stelle soll das Vorgehen nur umrissen wer- 
den. Die Mathematik findet sich im Anhang A.4.6 ab S.453. Die Rechenschritte 
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Abbildung 79: Fehler (y-Achse) in Abhängigkeit der Schaltschwelle c (x-Achse) 
für einen exemplarischen Klassifikator (M-0, V-F12, S-mda). Bei einer Schwelle von 
c=0 werden alle Laut als das Binärmerkmal aufweisend klassifiziert, daimmer r > c 
gilt. c = 0 korrespondiert mit einer Fehlerrate von e*(0) = 0,0 für die Stützlaute, 
also jener Laute, die das Binärmerkmal aufweisen. Ebenso ergibt sich aber auch ein 
totales Versagen für die Kontrastlaute, da jedweder Laut pauschal als das Merkmal 
nicht aufweisend klassifiziert wird - der Fehler ist hier maximal mit e” (0) = 1,0. Ein 
Anheben der Schwelle auf Werte ce > 0 lässt den Fehler e*(c) bei den Stützlauten 
wachsen (von links nach rechts ansteigende Kurve ‚Positiv‘ der x). Umgekehrt sinkt 
der Fehler e”(c) bei den Kontrastlauten (von links nach rechts abfallende Kurve 
‚Negativ‘ der +). Der totale Fehler e(c) ist das Maximum aus diesen beiden Fehlern 
(U-förmige Kurve der D). Die optimale Schaltschwelle c* liegt an dem Punkt, an 
dem der totale Fehler minimal ist, also ein Kompromiss aus dem Fehler bei den 
Stütz- und den Kontrastlauten gefunden ist. Die optimale Schaltschwelle c* = 0,33 
ist mit der vertikalen Linie markiert. Der totale und nun optimale Fehler beträgt 
hier &* = e(c*) = 0,15 und ist mit der horizontalen Linie angezeigt. 
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sind rein technischer Natur und erzeugen nicht ‚echte‘ Wahrscheinlichkeiten im 
streng mathematischen Sinn. Man erhält also wiederum Pseudowahrscheinlichkei- 
ten, allerdings solche mit kontrollierten und auf den VOKALJÄGER angepassten 
Eigenschaften. 

So werden die r; so zentriert, dass der Übergang von der Ablehnung zur Zustim- 
mung eines Klassifikators zu einem Binärelement bei exakt 0,5 stattfindet. Auch 
wird ein voll ausgeschöpfter Wertebereich von 0 bis 1 erzwungen. Rein technisch 
sind alle Pseudowahrscheinlichkeiten gleichwertig. Es hat sich jedoch technisch 
als vorteilhaft erwiesen, jene zu verstärken, die tendenziell größer sind und über 
einem bestimmten Stellwert liegen. Damit wird in einem Ensemble dem Klassifika- 
tor überproportional mehr Gewicht gegeben, dessen Schätzermodell das gesuchte 
Binärmerkmal mit höchster Zustimmung erkennt. Besonders niedrige Pseudowahr- 
scheinlichkeiten werden gänzlich ausgeblendet, da in diesem Bereich oft numerische 
Rausch-Artefakte vorgefunden wurden, die sich in der weiteren Verarbeitung als 
störend erwiesen. Letzteres ist signaltechnisch die Implementierung einer Rausch- 
sperre, noise gate. 

Waren die eben durchgeführten Skalierungsschritte noch klassifikatorintrin- 
sisch, wurden also auf Binärmerkmalsebene durchgeführt, bedarf es noch eines 
letzten Schritts auf Ensemble-Ebene. In der Nutzanwendung des VOKALJÄGERS 
werden die Binärklassifikatoren bzw. ihre Pseudowahrscheinlichkeiten in einem En- 
semble zusammengeschaltet. Es kann nun passieren, dass unterschiedliche Klassifi- 
katoren das betreffende Merkmal in einer Lautprobe zu erkennen vermeinen, womit 
die unschöne Situation entsteht, dass die technische Summe der Pseudowahrschein- 
lichkeiten über alle Klassifikatoren des Ensembles größer als 1 ist (ebenso kann die 
Summe kleiner 1 sein). Dies muss korrigiert werden, und zwar ensembleabhängig. 
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5.5 Der klassifikationsphonetische Kernalgorithmus 


In der Anwendung lernt der Klassifikationsalgorithmus nicht mehr anhand der im 
Trainingsmaterial vorgegebenen klassifikationsphonetischen Lautmerkmale. Der 
VOKALJÄGER klassifiziert jetzt die ihm vorgelegten Segmente selbstständig. Even- 
tuell vorhandene Lautklassifikationen werden nicht mehr genutzt. 

Am Anfang steht die Wahl des zu untersuchenden gleitenden phonetischen 
Merkmals. Daraus bestimmt sich das Ensemble des VOKALJÄGERS, welches ver- 
wendet bzw. geschaffen werden muss. Die nachfolgenden Schritte sind zwar in je- 
dem Ensemble dieselben, aber eine Lautprobe wird pro Ensemble bzw. pro gleiten- 
des Merkmal andere Merkmalswerte ( ergeben. Des Weiteren müssen die Kontrast- 
gruppen und Kontrastpaare bekannt sein, zwischen denen bzw. innerhalb derer die 
Merkmalsdifferenzen bestimmt werden sollen. Diese ergeben sich aus historisch- 
phonologischen Gesichtspunkten - eine vollumfängliche Definition und Diskussion 
dieser Kontrastgruppen findet sich in Kapitel 9 ab S. 283. 


1. Für jede Lautprobe wird die Wahrscheinlichkeit p(x) aus Formel (35) von S. 171 
errechnet. Dies geschieht jeweils für alle Binärklassifikatoren, also Kombina- 
tionen aus Schätzermodell und Prädiktorvariablen, die benötigt werden (die 
für endgültig verwendeten Binärklassifikatoren werden dann in Tabelle 25 auf 
S.227 aufgeführt). Damit die Rechnung brauchbare Ergebnisse liefert, müs- 
sen die p(x) in einem Trainingsprozess kalibriert worden sein (vgl. Abschnitt 
5.4, S.206£.). Die Wahrscheinlichkeiten werden aus dem Lautsignal errechnet, 
das die Lautprobe repräsentiert, was das Durchlaufen aller Prozessschritte des 
messphonetischen Kernalgorithmus voraussetzt (vgl. Abschnitt 3.7 auf $. 103). 


2. Pro Lautprobe wird der initiale Merkmalswert C° innerhalb des Ensembles mit 
Formel (35) von S.171 errechnet. 


3. Daraufhin werden die Lautproben in den jeweiligen Kontrastgruppen zusam- 
mengefasst und der Mittelpunktswert mit Formel (36) von $S.183 bestimmt — 
das ist der Merkmalswert ( (vgl. Abschnitt 5.2.1, S. 182£.). 


4. Pro Kontrastpaar wird die endgültige Merkmalsdifferenz A( mittels Formel 
(37) von $. 187 und ihre Signifikanz ermittelt (vgl. Abschnitt 5.2.2, S. 185f.). 


5. Ergänzende Maße, wie die numerische Dialektalität d (vgl. Abschnitt 5.2.2.3, 
S.188f.), die Bhattacharyya-Distanz COS (vgl. Abschnitt 5.2.3, S. 191f.) und 
die Merkmalsdifferenz zum Hochdeutschen (HP (vgl. Abschnitt A.4.2 auf S. 449), 
werden errechnet. 


Im Ergebnis hat man für jedes Kontrastpaar das Unterschiedsmaß AC vorliegen 
und kann daraus phonetisch-phonologische Schlüsse ziehen. 
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Kapitel 6 


Klassifikationsphonetische Ergebnisse 


Zusammenfassung: Dieses Kapitel dokumentiert die Kalibrierung der Klassifi- 
kationsalgorithmen auf das Hochdeutsche. Es zeigt sich, dass mit der Metho- 
de der Mixture-Discriminant-Analysis als Schätzermodell und den ersten drei 
Formanten als Prädiktorvariablen sehr gute Ergebnisse erzielt werden kön- 
nen (Abschnitt 6.1 ab S. 216). Die Merkmalswerte, die der VOKALJÄGER für 
die Öffnungsstufe der Hinterzungenvokale und den Rundungsgrad auf hoch- 
deutschen Daten und dem REDE-Material errechnet, entsprechen statistisch 
den Erwartungen voll (Abschnitt 6.2 ab S. 226). Dies ist in Abbildung 85 auf 
$.228 zusammengefasst. Im Ergebnis ist der VOKALJÄGER vollumfänglich als 
Werkzeug auf das Hochdeutsche kalibriert. Dies schafft die Grundlage für die 
Untersuchung historischer Tondokumente des Frankfurterischen. 
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6.1 Binärklassifikatoren ım Test 


Die Frage nach dem ‚richtigen‘ Binärklassifikator liegt auf der Hand. Wie sollen 
die Klassifikatoren für die Binärmerkmale aufgesetzt werden? Welche Prädiktor- 
variablen (Tabelle 22 auf S. 201) sollen mit welchen Schätzermodellen (Tabelle 23 
auf S.202) zur Schätzung welcher Binärmerkmale (Tabelle 21 auf $.198) einge- 
setzt werden? Um diese Frage zu beantworten, wurden über 3.000 Kombinationen 
testweise vermessen. 

Zur vergleichenden Gütebeurteilung der Schätzermodelle bietet sich der opti- 
male Fehler der Lauterkennung &* an (vgl. Abschnitt 5.4.5, $.208f., und Anhang 
A.4.5 ab $.452). Dies ist der kalibrierte Kompromissfehler zwischen dem Fehler 
in der Positivmenge (Stützlaute) und dem Fehler in der Negativmenge (Kontrast- 
laute). Dieser Fehler wird auf der Trainingsmenge, einer Untermenge aus HG1, 
bestimmt. Er soll hier ergänzt werden um den Fehler der Stütz- und Kontrastlau- 
te, gemessen auf der unabhängigen Kontrollgruppe HG2 (jeweils Mittel der Fehler 
pro Laut). Die auf HG2 gemessenen Fehler liefern einen Eindruck, welche Schwan- 
kungen um den auf HG1 gemessenen Wert zu erwarten sind. Da allerdings die 
Zielnutzung weder eine Lauterkennung ist noch auf hochdeutschen Daten basiert, 
können diese Werte nur indikativ sein. Auch ist bei den nominal hohen Zahlwerten 
des Kompromissfehlers zu beachten, dass dieser ein maximaler Fehler ist und über 
dem mittleren Fehler der Stütz- und Kontrastlaute liegt. Der Kompromissfehler 
als Messwert hat ebenfalls eine statistische Unsicherheit in der Größenordnung von 
15% (relativ), die hier als Basisunsicherheit bezeichnet werden soll”®. Zur Beur- 
teilung der Fehler im Vergleich wird eine Standard-ANOVA (analysis of variance) 
bzw. ANCOVA analysis of covariance verwendet°®. 


6.1.1 Zur Frage der Schätzermodelle 


Abbildung 80 auf S. 217 zeigt exemplarisch für einen ausgewählten Satz von Prä- 
diktorvariablen, den ersten drei Formanten V-F123, die Fehlerraten in Abhängig- 
keit vom Schätzermodell und vom Binärmerkmal. Für das im VOKALJÄGER vor- 
liegende, vergleichsweise einfache Klassifikationsproblem, lassen sich leicht brauch- 
bare Schätzermodelle mit guten Erkennungsraten aus dem Repertoire des Machi- 
ne-Learnings finden. Im Wesentlichen ergibt sich ein homogenes Bild, doch sind 
einige Abweichungen zu bemerken: Die vier Schätzermodelle, die auf der x-Achse 
weiter rechts aufgetragen sind, zeigen im Mittel die niedrigsten Fehlerraten über 


79 Bootstrapping-Standardfehler: Für einen Binärklassifikator zum Binärmerkmal M-O mit dem 
Variablensatz V-F123 und dem Modell S-mod ergibt sich z.B. für den Kompromissfehler 0,12 
+0,02. 

80Dje quotierten Kompromissfehler sind gemittelte ANOVA-Effekte, die sich aus einer hypo- 
thetischen Bereinigung des Messwertmittels um alle anderen Fffekte ergeben. 
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Binärklassifikatoren im Test 217 
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Abbildung 80: Fehler der Lauterkennung über HG1 (Kompromissfehler e*: Min- 
Prob) auf der logarithmischen y-Achse für verschiedene Schätzermodelle (x- Achse) 
und Laute bzw. Binärmerkmale (Felder). Ebenso gezeigt sind zur Kontrolle mittler- 
er Fehler der Stütz- bzw. der Kontrastlaute über die Kontrollgruppe HG2 (FNRTest 
bzw. FPRTest). Die vertikale Markierung zeigt das Schätzermodell S-mda an; die 
horizontale Linie entspricht einer Fehlerrate von 20%, die zur Orientierung einge- 
zeichnet wurde. Alle Messungen wurden mit den ersten drei Formanten als Prädik- 
torvariablen durchgeführt (V-F123). 
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alle Binärmerkmale. Untereinander weisen sie aber keine signifikanten Unterschie- 
de auf. Diese mit besonders niedrigem Fehlerquotienten abschneidenden Modelle 
sind die Support-Vector-Machine (S-svmRadial: 0,18 +0,08), die Mixture-Discri- 
minant-Analysis (S-mda: 0,18 +0,06), die k-Nearest Neighbors (S-knn: 0,17 +0,05) 
und das neuronale Netz (S-nnet: 0,18 +0,06). Die Modelle auf der linken Sei- 
te der x-Achse, die Quadratic Discriminant-Analysis S-qda, Naive Bayes S-nb 
und Regularized Discriminant-Analysis S-rda, schwanken leicht im Bereich höhe- 
rer Fehler. Das einfachste von allen Modellen, die Linear Discriminant-Analysis 
S-1da, schneidet am schlechtesten ab. Eine interessante Ausnahme ist das Ran- 
dom Forest Schätzermodell S-rf, welches verschwindend geringe Fehlerraten auf 
der Trainingsmenge HG1 erreicht. Allerdings findet hier eine Überadaption des 
Schätzermodells auf die Trainingsdaten statt. Messungen mit S-rf auf der Kon- 
trollgruppe HG2 zeigen Fehler in der Größenordnung der anderen Modelle. Auch 
bei alternativen Prädiktorvariablensätzen ändert sich das Bild nicht: Die Schätzer- 
modelle S-svmRadial, S-mda, S-knn und S-nnet schneiden im Mittel besser als 
der Rest ab, sind aber untereinander nicht signifikant verschieden. 


Der VOKALJÄGER nutzt als Standardschätzermodell die Mixture-Dis- 
criminant-Analysis (S-mda). 


Die Wahl wurde aufgrund der kontinuierlichen und leicht zu interpretierenden 
Pseudowahrscheinlichkeiten getroffen, die sich aus den zugrundeliegenden Normal- 
verteilungen ergibt (vgl. Abschnitt 5.3.5.4 auf S. 203). Hinsichtlich der Fehlerrate 
ist die S-mda nicht signifikant besser als die möglichen Alternativen S-svmRadial, 
S-knn oder S-nnet. 


6.1.2 Zur Frage der Prädiktorvariablen 


Abbildung 81 auf $.219 zeigt exemplarisch die Fehlerraten in Abhängigkeit von 
Binärmerkmal und Prädiktorvariablensatz für das nun als fix gewählte Schätzer- 
modell der Mixture-Discriminant-Analysis S-mda. Die Muster sind vergleichbar für 
die ähnlich gut funktionieren Schätzermodelle S-nnet, S-knn und S-svmRadial 
und nicht signifikant unterschiedlich. Deswegen ist in diesem Test auf die Rele- 
vanz der Prädiktorvariablen der Ausgangspunkt das ANOVA-Mittel über diese 
vier Schätzermodelle. Bei den Prädiktorvariablensätzen, die sich ausschließlich aus 
den Formanten ableiten, ergibt sich folgendes Bild: Die Variablensätze mit drei For- 
manten schneiden mit niedrigeren Fehlerraten signifikant besser ab (V- [FKH] 123: 
0,19+0,01) als die mit nur zwei (V- [FKH] 12: 0,21+0,01) oder gar die mit nur einem 
Formanten (V-F[12]: 0,45+0,02), was auch so erwartet ist. Die Verbesserung von 
zwei auf drei Formanten ist vergleichsweise gering. Der Unterschied zwischen den 
verschiedenen Ansätzen zur Formantextraktion ist gering und liegt unterhalb der 
Basisunsicherheit (13-Punkt, V-F1[23]: 0,24+0,01; %-Punk, V-H12[3]: 0,25+0,01; 
Scheitelpunkt, V-K12[3]: 0,25+0,01). Diese geringen Unterschiede decken sich mit 
den Ergebnissen von Son/Pols (1990, 1692). Es stellt sich heraus, dass alle An- 
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sätze, die auf robust lobanovnormalisierten Formanten basieren, signifikant bes- 
ser sind als jene, die originale, nicht normalisierte Formanten verwenden (V-R12: 
0,34+0,02). Auch dies ist nicht verwunderlich. Der bei weitem größte Effekt in die- 
ser Gruppe kommt allerdings von den Binärmerkmalen: Manche Binärmerkmale 
lassen sich signifikant besser klassifizieren als andere, was auch gut in der Grafik 
zu erkennen ist (die Fehlerraten sind für M-ii: 0,24; M-ee: 0,30; M-E: 0,17; M-aa: 
0,14; M-O: 0,27; M-oo: 0,22; M-uu; 0,27; M-RndFrnt: 0,39; M-nRndFrnt: 0,29; für alle 
gilt +0,02). Fants effektiver Formant (V-F1iM2) liegt etwa gleichauf mit M-F12 und 
im Kompromissfehler über M-F123 (+0,015), allerdings ist bei diesen Daten der 
Unterschied nicht signifikant. Syrdals Deltas (V-D012) schneiden auch schlechter 
ab als V-F123 (0,014; Unterschied nicht signifikant). 

Interessant ist das Hinzufügen von Variablen über Formanten hinaus (Basis 
ist hier der ANOVA-Kompromissfehler zu V-F123: 0,178+0,004). Ein Variablen- 
satz mit Grundfrequenz V-F012 ist eine gültige Alternative zu V-F123 (um —0,003 
verbesserter Fehler, aber nicht signifikant). Die Sätze mit den zusätzlich hinzu- 
genommenen Bandweiten (V-F123B1[2]) sind nicht besser, eher etwas schlech- 
ter (Fehler +0,005; nicht signifikant). Das Hinzunehmen der Intensität verbes- 
sert das Ergebnis kaum (V-F123e: —0,005; Unterschied nicht signifikant). DCT- 
Koeffizienten als Prädiktorvariablen schaffen eine geringfügige aber signifikante, 
Verbesserung (V-F123Y1[2]1: —0,014). Deutliche und signifikante Verbesserungen 
entstehen, wenn die Lautdauer berücksichtigt wird, entweder als MAD-normalisier- 
te Zeit (V-F123t: —0,031) oder in der Form von akkumulierter Intensität (V-F1231T: 
Verbesserung —0,035). 


Der VOKALJÄGER nutzt die klassischen drei Formanten V-F123 als 
Prädiktorvariablensatz und zwar in robust lobanovnormalisierter Form, 
extrahiert am %-Punkt. 


Auf die einzige signifikant bessere Alternative, das zusätzliche Nutzen der Laut- 
dauer, wird verzichtet: Die Korrelation von Qualität (Formanten) und Quantität 
(Lautdauer), hier für die Verbesserung des Kompromissfehlers verantwortlich, ist 
ein für das Hochdeutsche typisches Phänomen. Im Dialekt, der Nutzanwendung des 
VOKALJÄGERS, wäre eine solche Zwangsbindung kontraproduktiv, da hier Quali- 
tät und Quantität in Kombinationen auftreten können, die im Hochdeutschen so 
nicht vorkommen. Alle anderen besseren Alternativen komplexerer Variablensätze 
sind nicht so signifikant stärker, dass sie ernsthaft erwogen werden müssten und so 
fällt der VOKALJÄGER auf die am wenigsten komplizierte Konstellation, V-F123, 
zurück. 


6.1.3 Die ausgewählten Binärklassifikatoren 


Aus den vorherigen Abschnitten ergibt sich, dass die Binärklassifikatoren des VO- 
KALJÄGERs standardmäßig das Schätzermodell der Mixture-Discriminant-Analy- 
sis (S-mda) sowie die ersten drei Formanten als Prädiktorvariablensatz (V-F123) 
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nutzen. Tabelle 24 auf S. 222 führt die Statistik auf. Die Klassifikationsmuster sind 
exemplarisch in den Abbildungen 82 auf S.223 bis 84 auf S. 225 dargestellt und 
erläutert. 

Die Klassifikatoren wurden in mehreren hundert Versuchen optimiert. Es wäre 
durchaus zu erwarten, dass durch weitergehende Optimierung noch bessere Klas- 
sifikatoren bzw. nominal niedrigere Fehlerraten erreicht werden können. Doch die 
Klassifikatoren in vorliegender Form erweisen sich im Nutzeinsatz als völlig leis- 
tungsfähig, weshalb auf weitergehende Optimierung vorerst verzichtet wurde. 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


Klassifikationsphonetische Ergebnisse 


222 


'SYFDYLTIVMOA SIP UOTIEINSYUONPIEPULIG 9TP IST SOIAQ 
-(epu-g) [PPOULIDZILUIG STe SISATEUY-JURUTWULIISIZ-OAINIXTITN TOP pun (EZTI-A) ZIESUSTIELIEAIOHTTPRIA Se USJUBULIOT TIP U9IS.I9 
u9p me uU919ISEI U9IOFENLISSEIM 9][y "uUossepogsne purs U9P.IIM JI9LIOUST FUTUTEAIL, UNOg 9Ip ‘ne osfe 'oduauernoN Top 9NeT 
"1239893 JLIYIS TOfeıynau ur pums 9INepIse.1Juo‘y 9Ip — YJP4S9FURI0A 9fedg WUT9 pun I3PNAP93 1997 purs 9yneTzInIg 'opım m Yuuesy.o 
Fey1o[yoF IOYesysssefy] uoA "usqagague Jdoyusyfedg um arm ‘sInejJseuoy I9PpO -ZINIG SOp [IEJUY OYPpM re JAqT3 oyeLıoTyag IA 
“Jyarıdsyu9 9JToZ od umumxep) wop uormuyogq Od Op ‘,3 AOJyosstuoıdwoy I9p yone spe mer od uoyeniofyag Ip (N) Pfeuu 
-AIULIBUIG IP my purs Jıynjoamy 'THOH SFusuısdururem], I9p Ne SYADYLFTYMOA SOP U9IOFENTHISSEINIRUTG OP INH :FZ STTOqEL 


czo Too F00 TOO TOO TOO zzo FTo soo czo 3/o/1 yuagpuyu-y 

sto Too 900 zzo zTo ZTo sro 900 Foo 270  W/ö/:k  JUuXgpuy-N 

zo 770 100 100 8270 800 970 950 a 9-W 
9.0 970 ITo 000 600 600 €00 970 e ZAO-W 
610 020 600 900 200 000  FT'O 070 e ZHO-W 
910 9T0O 9T‘o ın nn-y 

970 ST'O 900 9T‘o Ko) 00- 

To zZTO 900 000 210 c O-W 

600 600 100 60°0 e ee-y 

£00 200 100 0To ITO 0T'O 3 I-N 

000 00 A270 70 20 9 99-N 

000 6TO 020 070 Hi TI-W 

a e 0 NV) 1A ın Ne) C e 3 Re) 1 „3  MejzinIg wa 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


Binärklassifikatoren im Test 223 


300 300 


400 400 
510 510 
640 640 


770 770 


12,5 10,0 7,5 12,5 10,0 7,5 


12,5 10,0 7,5 12,5 10,0 7,5 


Abbildung 82: Klassifikationsmuster der Binärklassifikatoren M-ii, M-ee, M-oo und 
M-uu, die im Wesentlichen den Lauten [ir/e:/o:/u:] entsprechen, in der F1/F2-Ebene 
(die Bezeichner sind pro Feld links unten gedruckt). Die schwarzen Dreiecke markie- 
ren korrekt als positiv identifizierte Stützlaute. Falsch negativ klassifizierte Stützlau- 
te sind mit x markiert. Bei den falsch positiv markierten Lauten (Symbol: graues 
Dreieck) ist zu beachten, dass diese vornehmlich in Regionen auftreten, die für das 
angesetzte gleitende Merkmal irrelevant sind. Zur Orientierung sind ausgewählte 
Laute, die nicht erkannt werden sollen, mit ihren Interquartilellipsen eingezeichnet. 
Korrekt negativ markierte Laute sind mit ‚— gekennzeichnet. 
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Abbildung 83: Klassifikationsmuster der Binärklassifikatoren M-E, M-0, M-6 und 
M-aa, die im Wesentlichen den Lauten [e/>/e/a:] entsprechen, in der F1/F2-Ebene 
(die Bezeichner sind pro Feld links unten gedruckt). Die schwarzen Dreiecke markie- 
ren korrekt als positiv identifizierte Stützlaute. Falsch negativ klassifizierte Stützlau- 
te sind mit x markiert. Bei den falsch positiv markierten Lauten (Symbol: graues 
Dreieck) ist zu beachten, dass diese vornehmlich in Regionen auftreten, die für das 
angesetzte gleitende Merkmal irrelevant sind. Zur Orientierung sind ausgewählte 
Laute, die nicht erkannt werden sollen, mit ihren Interquartilellipsen eingezeichnet. 
Korrekt negativ markierte Laute sind mit ‚— gekennzeichnet. 
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Abbildung 84: Klassifikationsmuster der Binärklassifikatoren M-@HZ, M-@VZ, 
M-RndFrnt und M-nRndFrnt, die im Wesentlichen den Lauten [o], [y:/e:/oe] und 
[i:/e:/e] entsprechen, in der F1/F2-Ebene (die Bezeichner sind pro Feld links unten 
gedruckt). Die schwarzen Dreiecke markieren korrekt als positiv identifizierte Stütz- 
laute. Falsch negativ klassifizierte Stützlaute sind mit x markiert. Bei den falsch 
positiv markierten Lauten (Symbol: graues Dreieck) ist zu beachten, dass diese vor- 
nehmlich in Regionen auftreten, die für das angesetzte gleitende Merkmal irrelevant 
sind. Zur Orientierung sind ausgewählte Laute, die nicht erkannt werden sollen, mit 
ihren Interquartilellipsen eingezeichnet. Korrekt negativ markierte Laute sind mit ‚—‘ 
gekennzeichnet. 
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In Abschnitt 6.1, S. 216f., wurde die Leistung einzelner Binärelement-Klassifika- 
toren in Isolation untersucht. Für den Nutzeinsatz im VOKALJÄGER werden nun 
die idealen Binärklassifikatoren aus Abschnitt 6.1.3, S. 220f., zu Ensembles bzw. 
gleitenden Merkmalen nach Tabelle 21 auf S.198 zusammengeführt. Die finalen 
Ensembles sind mit ihren technischen Bezeichnungen in Tabelle 25 auf S. 227 aufge- 
listet. Die nachfolgenden Test-Messungen als auch alle phonetisch-phonologischen 
Untersuchungen in Kapitel 9 ab S. 283 wurden mit diesen durchgeführt. Eine erste 
naheliegende Untersuchung ist das Verhalten des Schätzfehlers im Vergleich zwi- 
schen den Binärklassifikatoren in Isolation und denselben Klassifikatoren in einem 
Ensemble. Die Ergebnisse sind exemplarisch in Abbildung 86 auf S. 230 dargestellt 
und erläutert. 

Die Schätzfehler der einzelnen Binärklassifikatoren sind aber eher sekundäre 
Größen, da ja der VOKALJÄGER nicht Laute klassifiziert, sondern ein gleitendes 
Merkmal errechnet und zwar unter Berücksichtigung aller Klassifikatoren, die in 
einem Ensemble zusammengeschaltet sind. Dieser wesentliche Test wird im Folgen- 
den untersucht: Die Erwartung ist, dass gemessene Werte des gleitenden Merkmals 
mit jenen Vorgaben in Einklang sind, die sich aus der normativen IPA-Darstellung 
ergeben bzw. als Elementarausprägungen in den Ensembles angesetzt wurden. Ge- 
messen wurde zuerst über die hochdeutsche Trainingsmenge HG1 und die hoch- 
deutsche Testmenge HG2, für die jeweils die phonetische Transkription des Kiel- 
Korpus vorhanden ist. Um die prinzipielle Güte des gleitenden Merkmals auch für 
Tonproben zu überprüfen, die zum einen nicht zur Trainingsgruppe gehören und 
zum anderen nicht hochdeutsch sind, wurde darüber hinaus ein Test mit dem RE- 
DE-Material durchgeführt (vgl. Abschnitt 8.2.2 ab S. 276). Für diese Aufnahmen 
liegen vom REDE-Team durchgeführte qualifizierte ohrenphonetische Transkrip- 
tionen vor®!. Die Ergebnisse sind für die beiden wesentlichen Ensembles dokumen- 
tiert: Zur Öffnungsstufe der Hinterzungenvokale und für den Rundungsgrad der 
Vorderzungenvokale, siehe Abbildung 85 auf S. 228. 

Für die hochdeutsche Trainingsmenge HG1 ergeben sich für die Stützvokale 
Mediane, die exakt mit den Elementarausprägungen übereinstimmen und Vertei- 
lungen mit geringer Streubreite. Als Maß für die Streubreite gilt der Interquartil- 
bereich bzw. das 25%- und das 75%-Perzentil, die in der Notation der Ergebnisse 
in eckigen Klammern angegeben werden (vgl. Anhang A.2.4, S.439f.). Das hier 
präsentierte Ergebnis ist die Folge bestimmt gewählter Stellwerte bei der Reskalie- 
rung der Pseudowahrscheinlichkeiten (vgl. Anhang A.4.6, S. 453£.). Die Stellwerte 
wurden so bestimmt und dann fixiert, dass eine sehr hohe Passgenauigkeit für 


8! Es handelt sich hierbei um die Kurzfassungen der Aufnahmen zu den Wenkersätzen aus dem 
REDE-Material. 
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Abbildung 85: Der Merkmalswert ( im Praxistest. Dargestellt ist in der obe- 
ren Reihe der gleitende Merkmalswert der Öffnungsstufe der Hinterzungenvokale und 
in der unteren der des Rundungsgrads der Vorderzungenvokale (auf der y-Achse; der 
Median ist als Punkt und Ziffer im Feld gezeichnet; die Größe des Punkts korre- 
liert mit der Anzahl der Messwerte; der vertikale Strich ist der Interquartilbereich; 
Stützvokale sind mit einem vollen Kreis gezeichnet). Gemessen wurde über alle hoch- 
deutschen Sprecher der Trainingsgruppe HG1, der Testgruppe HG2 und der jüngeren 
Frankfurter Dialektaufnahmen bzw. des REDE-Materials (DRFA). Gruppiert wur- 
den die Daten um das im Kiel- bzw. REDE-Korpus angesetzte IPA-Lauttranskript. 
Die Ergebnisse, insbesondere für HG1 und HG2, decken sich erwartungsgemäß und 
vor allem für die langen Vokale meist mit dem für die jeweiligen Laute angesetzten GC 
der Elementarausprägungen. - Öffnungsstufe (oben): So erwartet man z.B.einC =3 
für [5]. Dieses misst man auch so auf HG1, HG2 und DFRA. Auch prognostiziert 
man ein(=1 für [ur], was sich auch auf dem Kiel-Korpus, sowohl im Training als 
auch im Test, so findet. Auf der völlig unabhängigen Menge DRFA hingegen bemerkt 
man eine deutliche Abweichung mit ( = 1,5 [1,0-1,7], was vermutlich auf die unüb- 
liche Zentralisierung des [u:] im Kiel-Korpus zurückgeht -— Rundung (unten): Man 
erwartet z.B. ein ( = 2 bzw. ‚rund‘ für [y:]. Dies misst man auch so auf HG1, HG2 
und DFRA. Man sagt ein ( = 1 bzw. ‚ungerundet‘ für [e] voraus, was sich auch 
auf dem Kiel-Korpus, sowohl im Training als auch im Test, so ergibt. Auf der völ- 
lig unabhängigen Menge DRFA hingegen bemerkt man eine deutliche Abweichung 
mit C = 1,5 [1,0-1,6]. - Wenn Abweichungen auftreten, dann nur bei für diese Arbeit 
eher nachrangigen Vokalen. Damit erweisen sich das Konzept und die Umsetzung der 
gleitenden Merkmale als völlig brauchbar für die Untersuchung des Frankfurterischen 
mit dem VOKALJÄGER. 
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das Hochdeutsche bzw. die Trainingsmenge HG1 erreicht wurde - für die hier 
durchgeführten Testmessungen auf HG2 und dem REDE-Material und vor allem 
für die Dialektuntersuchungen in Kapitel 9 ab S. 283 bleiben die einmal auf das 
Hochdeutsche bzw. HG1 kalibrierten Stellwerte unverändert. 

So misst man für die Stützvokale in HG1 präzise C = 4,0 [4,0-4,0] für [az], 
C = 3,0 [3,0-3,3] für [>], C = 2,00 [1,94-2,00] und d = 1,0 [1,0-1,6] für [u] 
bei der Öffnungsstufe der Hinterzungenvokale. Für den Rundungsgrad der Vor- 
derzungenvokale, wo ein Wert von 2 der Elementarausprägung ‚rund‘ und 1 der 
Elementarausprägung ‚ungerundet‘ entspricht, ist das Bild nicht anders. Bei den 
ungerundeten Vokalen misst man für [ir] und [er] jeweils G = 1,0 [1,0-1,0] sowie für 
[e] ein d = 1,0 [1,0-1,2]. Bei den runden [y:] und [e:] ergibt sich jeweils d = 2,0 
[2,0-2,0] und für [oe] ein € = 1,7 [1,5-2,0]. Das ist für HG1 nicht unerwartet, da ja 
der VOKALJÄGER auf diese Menge trainiert wurde. Aber auch in der getrennten 
hochdeutschen Testmenge HG2 misst man für die Stützvokale im Wesentlichen 
dieselbe Passgenauigkeit: C = 4,0 [4,0-4,0] für [ar], C = 3,0 [3,0-3,4] für [>], & = 2,0 
[2,0-2,0] für [o:] und C = 1,0 [1,0-1,7] für [ur]. Für die Rundung gilt das Gleiche. 

Der vollständig unabhängige Test auf dem phonetisch transkribierten REDE- 
Material vervollständigt die Beurteilung. Hier zeigt sich zwar eine höhere Schwan- 
kungsbreite, doch sind auch die Zentren für die Stützvokale meist exakt an den 
erwarteten Stellen. Dies gilt insbesondere für die langen Vokale, wo man ein ( = 4,0 
[3,4-4,0] für [ar], C = 3,0 [2,4-3,0] für [>] und C = 2,0 [2,0-2,0] für [o:] misst. Einzig 
bei [u:] liegt mit d = 1,5 [1,0-1,7] eine überaus deutliche, unerwartete Abweichung 
von dem Zielwert 1 vor. Eine Erklärung könnte sein, dass die [u:] im Kiel-Korpus 
tendenziell zentralisierter erscheinen und somit außerhalb des Kiel-Korpus keine 
geeignete Referenz darstellen (vgl. Abschnitt 4.6.1 ab S. 150). Da sich aber für die 
Untersuchung des Frankfurterischen mit dem VOKALJÄGER die Phänomene zwi- 
schen [a:] und [o:] abspielen und hier die Werte sauber sind, ist die Abweichung 
von [u:] erst einmal irrelevant und soll nicht weiter untersucht werden. Für den 
Rundungsgrad ergeben sich C = 1,0 [1,0-1,4] für [ir], © = 1,0 [1,0-1,3] für [er], 
C = 2,0 [2,0-2,0] für [y:] und < = 2,0 [2,0-2,0] für [er]. Auch hier sind die Werte für 
die kurzen Vokale mit C = 1,5 [1,0-1,6] für [e] abweichend, während die anderen 
(, wie z.B. ( = 2,0 [1,8-2,0] für [ce], passen. 

Interessant sind auch die Nicht-Stützvokale, die Zwischenwerte annehmen und 
tendenziell stärker streuen. So liegt [u] in HG1 auf dem Öffnungsgrad C = 2,0 
[1,6-2,5] und damit auf demselben Wert wie [or]. Das ist von den Formantmustern 
aus Abschnitt 4.6.2, S.154f., her nicht unerwartet. REDE hat mit ( = 2,0 [1,5-2,1] 
einen ähnlichen Wert. Das kurze [a] liegt in HG1 mit ( = 4,00 [3,84-4,00] gleichauf 
mit dem langen [a:] — für das REDE-Material findet sich eine leichte Abweichung 
in der Schwankungsbreite mit € = 4,0 [3,5-4,0]. In der REDE-Transkription finden 
sich einige weitere Nicht-Stützlaute, die aber, wie die Grafik zeigt, alle hinsichtlich 
der IPA-Normwerte gemäß Tabelle 2 auf S. 21 plausible bzw. mit den Formantmus- 
tern aus Abbildung 56 auf S. 151 übereinstimmende Muster bilden. Interessant ist, 
dass sowohl das IPA-[a] mit d = 3,3 [3,1-4,0] als auch das IPA-[p] mit C = 3,1 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


230 Klassifikationsphonetische Ergebnisse 


ByFtre, FNR ByFtre, FPR 
[m] 


aa [0] 00 uu aa [0] 00 uu ak EW 
ByLt, FNR ByLt, FPR D SW 


Fehlerrate 


[m] 
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Abbildung 86: Fehlerraten der Binärmerkmals-Klassifikatoren (Fehlschlag der 
Klassifikation bei Vorliegen des Merkmals, false negative rate: FNR) und dem mitt- 
leren Fehler zweiter Art (fälschliche Positiv-Klassifikation bei Nicht-Vorliegen des 
Merkmals, false positve rate: FPR). Die oberen beiden Bilder zeigen die Fehlerraten 
pro Elementar-Klassifikator an (vgl. Tabelle21 auf $.198), die unteren weisen aus, 
wie oft ein Laut falsch klassifiziert wird. Gezeigt sind Messungen in Isolation (SW) 
und im Ensemble (EW). Die Analyse ist exemplarisch gezeigt für das Klassifikator- 
Ensemble zur Ermittlung des gleitenden Merkmals der Öffnungsstufe der Hinter- 
zungenvokale und ist eingeschränkt auf die Vokale [a:/s/o:/u:] der Trainingsmenge 
HG1 (weshalb die Fehlerraten hier auch von denen aus Tabelle 24 auf S.222 ab- 
weichen). Durch die ‚Konkurrenz‘ im Ensemble steigt die FNR an und es sinkt die 
FPR. Dies liegt darin begründet, dass die Klassifikatoren unabhängig voneinander 
trainiert wurden und die Vokale stark streuen bzw. im Formantraum überlappen. 
Eine Optimierung ist denkbar durch kombiniertes Training der Modelle, doch würde 
dies zum einen den binären Charakter der Modelle als auch das Baukastenprinzip 
des VOKALJÄGERSs aufgeben. 


[3,0-3,7] hier eher im Bereich der Öffnungsstufe des [»] als der des [a] liegen. [x] 
mit C = 2,0 [2,0-2,0] und [a] mit d = 3,0 [3,0-3,0] finden sich hingegen auf den 
IPA-Lehrbuchwerten. Dies ist nicht selbstverständlich, da all diese Laute in HG1 
nicht vorkommen bzw. der VOKALJÄGER sie im Training nicht erlernen konnte. 


Die klassifikationsphonetischen Ergebnisse bestätigen im Schluss die Erwartung 
und qualifizieren den VOKALJÄGER für die Zwecke dieser Arbeit vollständig. 
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Frankfurterisch 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


Kapitel 7 


Der Frankfurter Stadtdialekt 


Zusammenfassung: Es ist ein glücklicher Zustand, dass zum Frankfurter Stadt- 
dialekt zwei wesentliche und unabhängige Bestandsaufnahmen existieren, die 
bisher noch nie komparativ phonetisch-phonologisch untersucht worden sind. 
Dabei handelt es sich um die handschriftlichen Aufzeichnungen Joseph Op- 
pels zwischen 1839 und 1894 und Ludwig Rauhs zwischen 1920 bis 1945. 
Dieses Material ist weitgehend noch nie in voller Präzision gedruckt worden, 
geht über das Frankfurter Wörterbuch hinaus und wird in Auswahl in die- 
ser Arbeit zum ersten Mal der Öffentlichkeit vorgestellt. Ergänzt wird Oppel 
und Rauh um die kurze, aber relevante Beobachtung von Wülcker aus dem 
Jahr 1877. Dazu kommt eine Vielzahl weiterer Belege, unter anderem aus der 
Mundartdichtung. Das Belegmaterial bildet die dritte Säule dieser Arbeit und 
wird in Kapitel 9 ab S.283 in Auszügen gedruckt. 


Dieses Kapitel definiert den Begriff Frankfurterisch als die rheinfränkische 
Mundart, die sich von den zentralhessischen Dialekten der Umgebung unter- 
scheidet und mit dem Gebiet der Stadt zusammenfällt. In dieser Definition 
stirbt der Dialekt um 1945 aus (Abschnitt 7.1 ab S.234). Weitere Abschnit- 
te stellen schon vorliegende Untersuchungen zum Frankfurter Stadtdialekt 
kritisch vor (Abschnitt 7.2 ab $.242), teilen den Untersuchungszeitraum in 
sogenannte Hauptperioden (Abschnitt 7.3 ab S.259) und umreißen die Umge- 
bungsdialekte (Abschnitt 7.4 ab S.262). Abschließend werden alle benutzten 
Quellen und die verwendeten phonetischen Transkriptionsregeln dokumentiert 
(Abschnitt 7.5 ab S.264). 
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7.1 Was ıst Frankfurterisch? 


Wie kann man Frankfurterisch®? definieren? Es sollen hier zuerst allgemeine Über- 
legungen angestellt werden — eine phonetisch-phonologische Beschreibung folgt 
dann in Kapitel 9 ab S.283. Für Frankfurterisch als eine Stadtmundart ist die 
Situation komplex. Es scheinen zumindest zwei Möglichkeiten offen: 


7.1.1 Frankfurterisch als Varietätenbündel am Ort Frankfurt 
Die erste und naheliegende Definition ist eine geographisch-deskriptive: 


Frankfurterisch ist die Menge der von den Frankfurter Bewohnern ge- 
sprochenen Varietäten. 


Doch was ist Frankfurt und wer sind die Bewohner von Frankfurt? Bis zum Abriss 
der Wallanlagen 1805 war die Stadt Frankfurt klar durch ihre Stadtmauern defi- 
niert®®. Aber bereits Anfang des 18. Jahrhunderts reichte das Gebiet der Freien 
Reichsstadt in den Taunus und südlich über den Main. Insbesondere die Dörfer 
Nieder- und Oberrad im Süden, Bockenheim im Westen sowie Hausen und Nie- 
derursel im Norden gehörten in dieser Zeit zum Frankfurter Landgebiet. Somit 
wies Frankfurt schon damals einen Teil ländlicher Bevölkerung auf. Und die Stadt 
Frankfurt hatte mit Sachsenhausen seit dem Mittelalter sogar einen ländlich ge- 
prägten Stadtteil innerhalb der Stadtmauern. Es zeigt sich eine Diversität der 
horizontalen und vertikalen Schichtung auf: Im selben Gebiet lebende Menschen 
sprachen ihrer Herkunft und Schicht nach unterschiedlich. Im Frankfurterischen 
des 19. Jahrhunderts läuft die Trennlinie hauptsächlich entlang der rheinfränkisch 
geprägten Sprache der mittleren Schichten der Kleinbürger, Handwerker, Kauf- 
leute usw. und der zentralhessisch geprägten Sprache der Gärtner, Heckenwirte, 
Fischer usw. aus Oberrad, Sachsenhausen und den von diesen Berufen bewohn- 
ten Straßen der Stadt, wie z.B. der Alten Gasse (vgl. hierzu Rauh 1921a, 1-26). 
Des Weiteren entwickelte sich eine zusätzliche soziale Trennlinie. Die Frankfurter 
Oberschicht der Großbürger und Patrizier wandte sich seit dem 19. Jahrhundert 
mehr und mehr der Mundart ab und dem Hochdeutschen zu und ihre Sprache war 
allenfalls noch halbmundartlich. Doch in der neu entstandenen Arbeiterklasse ge- 
wann die sich stetig wandelnde Mundart neue Träger. Eine geographisch zentrierte 
Definition hat die Herausforderung, die sich stetig variierende Sprachschichtung in- 
nerhalb eines geographischen Gebiets zu beschreiben. Folglich ergibt sich in dieser 
Definition nicht ein Frankfurterisch, sondern viele frankfurterische Varietäten, die 


82Die Begriffe Frankfurterisch, Frankfurter Stadtmundart und Frankfurter Stadtdialekt werden 
hier stets synonym gebraucht. 

83 Alle Daten zu Frankfurt sind Battonn (1869), Bothe (1911), Bothe (1988), Rauh (1921a) 
und Kramer (1964) entnommen. 
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Abbildung 87: Das durchgehend bebaute Gebiet der Stadt Frankfurt um 1800, 
1890 und 1925 sowie der umliegenden Vororte. Die gepunkteten Linien skizzieren 
die politische Situation um 1830: Der Nordosten gehörte zu Hanau, der weitere Sü- 
den und Norden zum Großherzogtum Hessen (auch: Rödelheim, früher zu Solms), 
der Westen zu Mainz bzw. Nassau. Seit dem Mittelalter war Sachsenhausen Teil 
von Frankfurt. Hausen und Niederursel standen im Besitz Frankfurts. Eingemeindet 
wurden in die Stadt Frankfurt: 1877 Bornheim; 1895 Bockenheim; 1900 Oberrad, 
Niederrad und Seckbach; 1910 Ginnheim, Praunheim, Heddernheim, Eckenheim und 
Preungesheim; 1911 Rödelheim. Eigene Skizze nach Ravenstein (1833), Bothe (1911, 
47 und Beilage 6), Hattemer (1912) und Ruppersberg (1927, 23). 
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am Ort Frankfurt gesprochen werden. Hinzu kommt, dass der Ort bzw. die Geo- 
graphie Frankfurt nicht konstant ist. Abbildung 87 auf S. 235 zeigt die Entwicklung 
der Stadt. Bis Anfang des 19. Jahrhunderts ist Frankfurt mehr oder weniger gleich 
groß geblieben, doch danach wächst die Stadt rapide. Die umliegenden Dörfer 
werden nach und nach eingemeindet. 


7.1.2 Frankfurterisch als kontrastive Inselvarietät 


Die zweite Definitionsmöglichkeit ist dialektal kontrastiv: 


Frankfurterisch ist die in Frankfurt gesprochene homogene Varietät, 
die sich deutlich sowohl vom Dialekt der weiteren Umgebung als auch 
vom Hochdeutschen abhebt. 


Ein Blick in die historischen Lautbelege der unmittelbaren nördlichen und südli- 
chen Vororte und die Karten des Deutschen Sprachatlasses offenbart: Frankfurt 
lag vokalisch als rheinfränkische Sprachinsel in einem zentralhessischen Gebiet 
(vgl. Abschnitt 7.4 ab $.262). Das Zentralhessische der Wetterau ist die Sprache 
der Frankfurter Vororte und reichte bis Dreieich im Süden. Hierbei war Anfang 
des 20. Jahrhunderts die zentralhessische Prägung des südlichen Sachsenhausens, 
Oberrads, Götzenhains und Offenthals sowie des nördlichen Seckbachs, Preun- 
gesheims, Berkersheims und des Taunus noch stärker als im nördlichen Ecken- 
heim, Eschersheim, Bonames, Praunheim, Heddernheim, Ginnheim, Niederursel, 
Hausen und Rödelheim (Rauh [1921a, 8-19], Freiling [1924], Freiling [1925] und 
Born [1938, 160]). Der Inselstatus hat, wie schon erwähnt, politisch-sozialen Hin- 
tergrund. Frankfurt war immer Freie Reichsstadt bzw. Freie Stadt, während die 
Umgebung unter feudaler Herrschaft stand. Frankfurt war Bürgerstadt in Bau- 
ernland. In diesem Verständnis ist Frankfurterisch nicht durch eine geographische 
Grenze definiert. Vielmehr definiert eine signifikante Sprachgrenze die Geographie 
der Mundart. 


7.1.3 Definition des Frankfurterischen 


Für die Arbeit mit dem VOKALJÄGER soll eine Kombination der Möglichkeiten aus 
den vorangegangenen Abschnitten verwendet werden. Um Frankfurterisch zu ana- 
lysieren - und dann ein historisches, rückerschlossenes und idealisiertes klassisches 
Frankfurterisch zu definieren — wird zum einen auf einen Fundus verschriftlichter 
historischer Lautbelege aufgesetzt (vgl. Abschnitt 7.2 ab S. 242). Hier handelt es 
sich insbesondere um die im Frankfurter Institut für Stadtgeschichte eingelagerten 
Aufzeichnungen von Hans Ludwig Rauh und Joseph Oppel aus dem 19. und 20. 
Jahrhundert und ganz besonders um Rauhs handschriftliche Lautlehre der Frank- 
furter Stadtmundart (Rauh 1921a). Zum anderen soll bewusst die Variabilität von 
Einzelbelegen gegenüber dieser idealisierten Form anerkannt und untersucht wer- 
den. Hier ist der Fokus auf unmittelbar zugängliche Varietäten in Tondokumenten 
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Abbildung 88: Frankfurterisch im weiteren Sinn als die rheinfränkische Varietät 
der Schicht der Kleinbürger und Arbeiter, kontrastiert zu den halbmundartlichen 
Varietäten der Oberschicht und den zentralhessischen Varietäten der Vororte. Die 
frankfurterische Varietät ist in einem zeitlichen Wandel über sogenannte Hauptperi- 
oden begriffen (vgl. Abschnitt 7.3 ab S.259). 
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gesetzt. Diese werden mit dem VOKALJÄGER vermessen und können so gegen 
das idealisierte klassische Frankfurterisch quantitativ kontrastiert werden. Es wird 
angesetzt: 


Frankfurterisch sei die rheinfränkische Varietät der Kleinbürger und 
Arbeiter, die einzig in der Stadt Frankfurt gesprochen wird. 


Dieses Frankfurterisch wurde von den Forschern Oppel, Wülcker und Rauh als 
‚Frankfurter Stadtmundart‘ benannt und lautschriftlich belegt. Der Kontrast zwi- 
schen dieser Varietät und der zentralhessischen Varietät am geographischen Ort 
Frankfurt, insbesondere den Vororten, wird anerkannt. Das Gleiche gilt für das 
soziokulturelle Spannungsfeld, das daraus entsteht und z.B. in der Frankfurter 
Mundartliteratur immer wieder thematisiert wird (Bürger vs. Bauer). Entspre- 
chend erhalten hier die zentralhessisch geprägten Vorortdialekte ihr Gewicht. Auf- 
grund der guten Beleglage sind das vor allem Sachsenhausen und Oberrad. Gege- 
benenfalls wird dann vom Frankfurterisch der Vororte gesprochen. Das Gleiche gilt 
für die Varietät der Oberschicht, die hier, Oppel folgend, als vornehm Frankfurte- 
risch bezeichnet werden soll®*. Faktisch ist der Lautstand des Frankfurterischen um 
1920 mit Rauh (192l1a) und Rauh (1921b) am besten strukturiert dokumentiert. 
Deswegen wird angesetzt: 


Frankfurterisch - im engeren Sinn — sei die von Rauh lautschriftlich 
belegte rheinfränkische Varietät der Kleinbürger und Arbeiter am Ort 
Frankfurt um 1920. Dies sei hier als klassisches Frankfurterisch, abge- 
kürzt kFra, bezeichnet. 


Das klassische Frankfurterisch ist der Eichpunkt dieser Arbeit und alle anderen 
Belege, Untersuchungen und insbesondere die mit dem VOKALJÄGER untersuch- 
ten Tondokumente werden mit ihm in Bezug gesetzt. Anders als für Rauh um 
1920 ist aber heute viel mehr Material zur Frankfurter Mundart bekannt - insbe- 
sondere kannte Rauh zum Zeitpunkt seiner Dissertation noch nicht die Aufzeich- 
nungen Oppels aus dem 19. Jahrhundert. So ist es heute möglich, Aspekte des 
Varietätenwandels zu beschrieben. Dazu wird die maßgebliche Zeit des 19. und 20. 
Jahrhunderts in sogenannte Hauptperioden eingeteilt, über die ein Sprachwandel 
beobachtet werden kann (vgl. Abschnitt 7.3 ab S. 259). Es wird sich also nicht nur 
auf das eine klassische Frankfurterisch beschränkt. Vielmehr kann ergänzt werden: 


Frankfurterisch ist eine historische Folge der rheinfränkischen Varie- 
täten am Ort Frankfurt. In jeder Periode steht dieses Frankfurterisch 
jeweils im Kontrast zu der rheinfränkischen halbmundartlichen Varie- 
tät und den zentralhessischen Varietäten der Vororte. 


Dieser Zusammenhang ist in Abbildung 88 auf S.237 veranschaulicht. Die Do- 
kumentation ist in dieser Arbeit allerdings bewusst nicht umfassend — das mag 


84Obwohl die Datenlage explizit derart markierter Belege eher dünn ist. 
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einer Folgepublikation vorbehalten bleiben - sondern fokussiert exemplarisch auf 
vokalische Einzelphänomene und in Sprachproben manifestierten Varietäten, die 
mit dem VOKALJÄGER untersucht werden können. Es wird eine Bindung an die 
Geographie Frankfurts und das Kontrastargument gesucht: 


Nur, solange die am Ort Frankfurt gesprochene rheinfränkische Varie- 
tät distinktiv zu ihrer zentralhessischen Umgebungsvarietät ist und der 
Ort Frankfurt ausschließlich Repräsentant dieser Varietät ist, soll von 
Frankfurterisch die Rede sein. 


Im Lauf der Zeit hat sich die Sprachgrenze, die einst eng um Frankfurt herumlief, 
markiert durch die zentralhessisch sprechenden Vororte, so weit aufgebläht, dass 
sie heute große Teile des Rhein-Main-Gebiets als mehr oder weniger homogenen 
Sprachraum umfasst. Man kann diesen Ausgleichsregiolekt Neu-Frankfurterisch 
nennen, denn er wird ja von Frankfurtern als ‚Frankfurterisch‘ bezeichnet oder ihn 
mit Dingeldein (2007) als RMV-Hessisch bezeichnen. Aber dieser Ausgleichsregio- 
lekt ist kein Frankfurterisch mehr nach den Definitionen dieses Abschnitts. Mit 
der Auflösung der mit der Stadt Frankfurt identischen rheinfränkischen Sprachin- 
sel im Zentralhessischen ist Frankfurterisch untergegangen. Wie sich zeigen wird, 
fällt dies in die Zeit unmittelbar nach dem Zweiten Weltkrieg. 


7.1.4 Belege des Frankfurterischen 


Welche Belege zum Frankfurter Stadtdialekt gibt es? Für die vorliegende Unter- 
suchung zum Frankfurter Stadtdialekt wurde eine Vielzahl von Quellen gesichtet 
— die vollständige Liste und die verwendeten Siglen finden sich dann in Abschnitt 
7.5.1 ab S. 264. Die Quellen fallen konzeptionell in die folgenden Klassen oder Ty- 
pen, wobei Typ 1 das für den VOKALJÄGER maßgebliche Material ist und Typ 2 
bis 4 den Referenzrahmen bilden: 


7.1.4.1 Typ 1: Tondokumente 


Tonaufnahmen von Frankfurter Dialektsprechern können mit dem VOKALJÄGER 
mess- und klassifikationsphonetisch untersucht werden. So entsteht ein unmittel- 
barer quantitativer Zugang zu den Lauteigenschaften der gesprochenen Mundart. 
Besonders interessant ist hier die Frankfurter Aufnahme aus dem Lautdenkmal 
reichsdeutscher Mundarten von 1937 sowie das Frankfurter Material des Regional- 
sprache.de (REDE) Projekts aus dem 21. Jahrhundert. Dieser für den VOKALJÄ- 
GER wichtige Datenblock wird in dem separaten Kapitel 8 ab S. 273 beschrieben. 


7.1.4.2 Typ 2: phonetisch-phonologische Arbeiten 


In diese Klassen fallen wissenschaftliche Texte und Darstellungen, die einen Schwer- 
punkt auf der Dokumentation der Frankfurter Laute haben. Wenn man die bisher 
nicht gedruckten Werke zum Frankfurterischen mitzählt, gibt es zu Frankfurt eine 
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Fülle von Material, was bisher nicht komparativ ausgewertet wurde. Besonders 
hervorzuheben ist das Material von Oppel (vgl. Abschnitt 7.2.2 ab S. 242) sowie 
die Anmerkungen von Wülcker (vgl. Abschnitt 7.2.4 ab $.249) und insbesonde- 
re Rauh (vgl. Abschnitt 7.2.7 ab S.253). Das Frankfurter Wörterbuch, sowohl in 
seiner sechsbändigen Druckfassung als auch in der originalen Zettelsammlung, ist 
ein unschätzbarer Fundus (vgl. Abschnitt 7.2.8 ab $.254). Die wichtigsten For- 
scher sind chronologisch in dem Abschnitt 7.2 ab S. 242 beschrieben. Zu den Um- 
gebungsdialekten existiert eine Vielzahl von Lautlehren, die in Abschnitt 7.4 ab 
5.262 aufgeführt werden. 

Für das Frankfurterische gibt es direkte und indirekte Quellen: Direkte Quellen 
sind jene, denen die Beschreibung oder Reproduktion des Frankfurterischen zentral 
ist. Indirekte Quellen sind solche, die einen anderen Dialekt im Fokus haben, aber 
Frankfurterisch kontrastiv behandeln. Dies ist z.B. in manchen Lautgrammatiken 
aus der Frankfurter Umgebung der Fall. Die Lautgrammatiken und Lautdokumen- 
te der Umgebungsdialekte werden - in Auswahl - als kontrastive Referenzpunkte 
für das Frankfurterische angesetzt. 


7.1.4.3 Typ 3: Mundartliteratur 


Mundartliteratur ist eine bewusste und lautmalerische Verschriftlichung des Laut- 
stands eines Dialekts. Anders als für phonetisch-phonologische Arbeiten, ist die 
Zielgruppe hier ein Laienpublikum. Auch deshalb bedient sich der Mundartdichter 
in der Regel der Schriftzeichen der hochdeutschen Schriftsprache und verwendet 
damit keine phonetisch exakten Bezeichner. Während manche Dialektformen ge- 
nau markiert werden können, wie (aa) für das Monophthongierungs-A gegenüber 
schriftsprachlichem (ei) oder (ou), ist dies für gerade den Fokus-Vokal dieser Ar- 
beit, das A, schwer möglich. Oft ist der Lautstand nicht durchgängig immer mit 
denselben Zeichen gesetzt bzw. nicht normalisiert und ein Wort kann sowohl in 
hochdeutscher als auch dialektaler Form wechselnd erscheinen - und ob das eine 
bewusste Wahl war, ist nicht mehr erkenntlich. Vermutlich war der Lautstand, den 
die Mundartliteratur zeichnet, hoch korreliert mit dem realen damaligen Sprach- 
bild, aber auch das mag nicht immer zutreffen: So kann der Dichter zur Dialektmar- 
kierung z.B. archaische Formen verwendet haben, die zu dieser Zeit gar nicht mehr 
gesprochen wurden. In nur ganz wenigen Fällen erläuterten Frankfurter Mundart- 
dichter ihre Schreibung bzw. den verwendeten Dialekt. Dazu gehört zum einen Carl 
Malß, was hier in Abschnitt 7.2.1 ab S. 242 beschrieben ist. Zum anderen finden 
sich von Friedrich Stoltze vereinzelte Anmerkungen in seiner Frankfurter Latern, 
und zwar, wenn er zu Leserbriefen Stellung nimmt (Stoltze/Schalck 1860-1893). 
Für das Frankfurterische kommt erschwerend hinzu, dass der Dialektdichter 
oft das Zentralhessische der Vororte mit einmischt. Und es ist nicht bekannt, ob 
dies bewusst oder unbewusst geschah. Auch kann man sicher davon ausgehen, 
dass der Lautstand der ältesten Mundarttexte, die Frankfurt zugewiesen werden, 
nicht Frankfurterisch sind: Die Gedichte „Der Mutter Töchter Sprache“ und „Des 
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Kaisers Tod“, die auf etwa 1730 und 1765 datiert werden, sind eindeutig zentral- 
hessisch bzw. sachsenhäuserisch®®. Manche Frankfurter Dialektdichter, wie z.B. 
Malß oder Hallenstein trennen aber sauber zwischen Frankfurter Sprechern und 
denen der Vororte, wobei dies oft künstlerisch für den Kontrast bürgerlich-fein 
gegen bäuerlich-grob genutzt wird. Weitergehende Übersichten über und Einfüh- 
rungen in die Frankfurter Mundartliteratur findet sich bei Askenasy (1904, 1-14 
und 249-332) und Alsheimer (1988, 10-17). 

Für diese Arbeit werden Mundartbelege informativ beigelegt und zur Auswer- 
tung nur herangezogen, wenn sich aus ihnen der Lautstand eindeutig erkennen 
lässt. 


7.1.4.4 Typ 4: Mundartlich geprägte Schreibungen 


In diese Klasse fallen vor allem handschriftliche Urkunden aus der Zeit vor Nor- 
mierung der Schreibung. Für das Frankfurterische ist hier vor allem die Analyse 
mittelalterlicher Zeichen nach vermuteten Lautwerten in Wülcker (1877) wichtig. 
Weiteren Aufschluss bietet die Schreibung von Schlüsselwörtern in alten Urkun- 
den im Lauf der Zeit, z.B. Örtlichkeitsbezeichnungen in und um Frankfurt (Böh- 
mer [1970], Battonn [1869], Grotefend [1884 und 1888], Horne [1897] und Bücher/ 
Schmidt [1914, 1915]). Abschriftliche Belege sind allerdings mit Vorsicht zu genie- 
ßen und können nur genutzt werden, wenn die Schreibung deutliche Indikation für 
den Lautwert ist, z.B. im Fall des Monophthongierungs-A. Deswegen tritt dieser 
Belegtyp in vorliegender Arbeit gegenüber den anderen Belegen zurück. 


85Das Gedicht Der Mutter Töchter Sprache ist original in einem Buch von Picander (das ist 
Christian Friedrich Henrici, 1700-1764) zu finden, einem unbekannten Verfasser zugeschrieben 
und in Kramer (1966, 17-18) abgedruckt und kurz erläutert. Hier stehen deutlich zentralhessische 
Formen wie z.B. (Bruhd) für Brot oder (schiener) für schöner. Das Gedicht Des Kaisers Tod 
wurde Anfang des 20. Jahrhunderts im Frankfurter Stadtarchiv gefunden und ist in Jung (1917) 
abgedruckt sowie hinsichtlich des Lautstands kommentiert. Vom Inhalt her kann man es auf 
das Ende des 18. Jahrhunderts datieren. Zentralhessische Formen sind hier z.B. (giht) für geht 
oder (Suhn) für Sohn. Dieser Zentralhessische Lautstand ist übrigens genau derselbe, der sich im 
Sachsenhäuser Vater Unser von ca. 1800 wiederfindet: Auch hier steht z.B. (Bruhd) für Brot. 
Dieses Gebet ist ebenfalls in Kramer (1966, 24) abgedruckt. Damit kann man schließen, dass die 
beiden Gedichte höchstwahrscheinlich sachsenhäuserisches Zentralhessisch, aber auf gar keinen 
Fall rheinfränkisches Frankfurterisch sind. 
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7.2.1 Carl Balthasar Malß (1792-1848) 


Der Dichter Carl Malß ist vor allem bekannt für seine Frankfurter Mundartstücke. 
Doch legte er seinem Mundartstück Der alte Bürgercapitain von 1821 ein „Wörter- 
buch“ bei®®. Dieses enthält in einem einleitenden Abschnitt „Allgemeine Anmer- 
kungen“ zur Aussprache des Frankfurterischen der Zeit (Malß 1833b) Hier finden 
sich Anmerkungen zum dunklen A des Frankfurterischen und zum nasalierten Mo- 
nophthongierungs-A, die hier herangezogen werden (vgl. Abschnitt 9.8 ab S. 351). 


7.2.2 Johann Joseph Oppel (1815-1894) 


Über Joseph Oppel als Person ist relativ wenig bekannt, außer dass er am 23. Juni 
1815 in Frankfurt geboren wurde und ab 1845 Professor am Frankfurter Gym- 
nasium für Naturwissenschaften war (Riese [1920], Alsheimer [1988, 17-18] und 
Schanze [1988, 16-54]). Aber er war der erste Frankfurter Mundartforscher und 
beschrieb vom Winter 1839/1840 bis zu seinem Tod 1894 insgesamt 88 Faszi- 
kel (Schreibhefte) zu je 16 Seiten mit detaillierten Anmerkungen zum Frankfurter 
Stadtdialekt, die heute im Frankfurter Institut für Stadtgeschichte eingelagert sind 
(Oppel 1839-1894). Oppel führt sich selbst als jemanden ein, „der sich von Jugend 
auf für Dialekte überhaupt und insbesondere für den seiner Vaterstadt Frankfurt 
a. M. interessierte“ (Oppel 1869, ebenso alle Zitate von Oppel im Folgenden). Seine 
Tochter Franziska charakterisierte ihn in einem Mundartbändchen in den 1920ern 
wie folgt: 


„Was mich anbelangt, so is mer unser Dialekt e Liedche aus der Kindheit, e Klang aus 
der Jugendzeit, der mich begleite soll un werd, so lang ich leb. Dass ich em awwer noch 
e besonner Int’resse entgegenbring’, des hat sein Grund darin, dass mein Vadder sich’s zur 
Lewensaufgab’ gemacht gehabt hatt’, e Werk iwwer den Frankforter Dialekt heraus zu gewwe, 
— nadierlich uff wissenschaftlicher Grundlag mit ere Grammatik un was dazu geheert, wann e 
Gelehrter so was in die Händ’ nimmt. Sein Plan is awwer net, mehr zur Ausführung gelangt; 
des ganze gesammelte Material ligt jetzt hier im Archiv un Herr Professor Riese hat e sehr 
nett Broschür driwwer eraus gewwe. So lang ich denke kann, hat mei Vadder Material zu 
dem Werk zusamme getrage. Er hat sich uff den Markt gestellt und hat zugeheert, was die 
Hockinne minanner gebabbelt hawwe, er hat sich dazugesetzt, wann die alde Frankforter 
Hausfraue sei Mudder besucht hawwe un was se sich verzehlt hawwe, hat er immer in e klää 
Bichelche geschriwwe“ (Zilcher-Oppel 1928, 2-3). 


86Dje vollständige Fassung des Wörterbuchs findet sich nur in den frühen Kommissionsausga- 
ben von Varrentrapp aus der ersten Hälfte des 19. Jahrhunderts. Die Fassung Sauerländers aus 
der zweiten Hälfte des 19. Jahrhunderts ist schon gekürzt. In modernen Drucken, wie z.B. in 
Kramer (1966) kann das Wörterbuch auch vollständig fehlen. 
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Bei dem von Franziska beobachteten „klää Bichelche“ handelt es sich wohl um 
eines der Faszikel®”. 

Oppels selbstgesetztes Ziel war es, ein „Frankfurter Idiotikon“ zu verfassen, wie 
er 1869 - nach dreißig Jahren Sammelarbeit! - in einem kleinen Zeitungsartikel 
schrieb, wo er um Unterstützung für sein Projekt bei den „Sachverständigen |...] 
und namentlich auch den Gelehrten unter seinen geehrten Mitbürgern“ bat (Oppel 
1869). Sein Werk sollte unter anderem eine Lautlehre „der rein phonetischen Cha- 
rakterisierung und Feststellung der vorkommenden Sprachlaute und Bezeichnung 
derselben durch Buchstaben“ sein, ergänzt um „Formen- und Wortbildungslehre, 
Lexigraphie“ und vor allem viele Beispiele, wie „Zwiegespräche, kleine Erzählun- 
gen, Anekdoten, Dicta, Räthsel, Lieder und Volksmelodien“. Wichtig war ihm „da- 
bei zum größeren Teil mündliche Quellen“ zu benutzen und er war sich der Gefahr 
von Mundartdichtung als Zeugnis wohl bewusst: „[DJie Lokalliteratur ist nur mit 
großer Vorsicht zu gebrauchen“. 

Dazu erfand Oppel eine phonetische Umschrift, die mit expliziten Nummern 
den Vokalklang anzeigt und hier in Tabelle 26 auf S. 245 dokumentiert ist. Tabelle 
27 auf S.246 verortet Oppels Vokale in dem modernen IPA-Schema und Abbil- 
dung 89 auf S. 247 zeigt Oppels kreative Versuche, ein eigenes Ordnungssystem zu 
schaffen. Für das im Frankfurterischen so wichtige dunkle A, seine Vokalnummer 
11, hatte Oppel zusätzlich die Schreibweise mit übergesetztem O, also (ä). Damit 
kann das dunkle A auch identifiziert werden, falls die Vokalnummer fehlt. Zwar ist 
so der Lautstand einfach zugänglich, doch viele von Oppels prosaischen Anmer- 
kungen und Erläuterungen sind in einer selbst erfundenen Geheimschrift notiert, 
die den Zugang zu den Originalfaszikeln erschwert. 

Die Faszikel sind mit Tinte oder Bleistift geschrieben und mit etwa 25 Zeilen 
pro Blatt und 10 Wörtern pro Zeile recht gedrängt notiert. Oppels Aufzeichnun- 
gen erscheinen in der Regel völlig unstrukturiert als eine Folge von nur wenigen 
Zeilen langen Abschnitten, jeweils mit horizontalen Trennstrichen abgegrenzt, die 
unterschiedliche Themen behandeln. Die Hefte sind undatiert und auch aus ihrer 
offensichtlich nachträglich angebrachten Nummerierung scheint sich keine zeitliche 
Reihung erschließen zu lassen. 

Als Beispiel von Oppels akribischer Arbeit sei hier ein bisher unveröffentlichtes 
„Kinderliedchen (in Frankfurt sehr häufig)“ mit seinen Vokalnummern abgedruckt: 


Eins, zwei, drei, (|...| zuweilen auch: änzwä drai!) 
higeböre hai 

higeböre pöfferkörn 

der Miller höt sai Fra ferlörn 

der Bauer hötse gefünne 

des Hömelche schlecht di Drüme 

des Moisi des sitzt üfm Däch | 


877u der merkwürdigen Schreibung des Monophthongierungs-A als (klää) vgl. Abschnitt 9.8.1 
ab S.351. Die „nett Broschür“ ist vermutlich der Artikel Riese (1920). 
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ün höt sich schön hälb grängk gelächt 
haha hähä hä! 


(aus dem 5. Faszikel in Band I, laufende S. 70). Ein weiteres Beispiel ist „Noch ein 
Frankfurter Volks- und Kinderverschen“ aus demselben Faszikel: 


es höt &möl ger&chend 

dı döcher drebele nöch 

ich höb (auch: höw) &möl en Schäz gehölr]t 
ich wölt ich hetten nöch. 


Oppels Vokalnummern sind nur in Ausnahmefällen so durchgängig notiert, wie in 
diesen Beispielen. In der Regel beschränken sie sich auf einzelne Laute, aber mit 
einem starken Fokus auf jene, die für den Frankfurter Dialekt relevant sind. 

Sehr wichtig festzustellen ist, dass Oppel Naturwissenschaftler und kein Ger- 
manist war. Oppel notierte und sammelte sauber, konnte aber zum Zeitpunkt der 
Niederschrift der Notizen noch keine Erklärung für das Warum des Lautstands 
liefern — dies wäre möglich gewesen, wenn er das idealisierte Referenzsystems der 
Altlaute, etwa des Westgermanischen oder Mittelhochdeutschen gekannt hätte®®. 
Nach dreißig Jahren Sammelarbeit kam er 1869 zwar „zu einer immer klareren und 
schärferen Charakteristik der strengen Gesetze und Regeln, welche der Gestaltung 
der |...| Mundart |...| zu Grunde liegen“. Auch strebte er an, eine Sprachgeschichte 
des Frankfurterischen zu liefern: „Gesetze der Lautverschiebung gegen das Neu- 
hochdeutsche, beziehungsweise Mittelhochdeutsche und einige andere germanische 
Idiome“. Doch blieb das alles ein Plan und die zum Ende seiner Zeit angestrebte 
germanistische Rahmung findet sich in seinen Faszikeln noch nicht. Oppel schlug 
die Warnungen in den Wind: 


„Nun wird aber dem Unterzeichneten neuerdings von befreundeter Hand mehrfach (und gewiß 
mit Recht) darauf hingedeutet, daß er bereits in ein Alter trete, wie das Verschieben einer 
größeren Arbeit an sich nicht mehr räthlich erscheint, daß überhaup das ‚Bessere gar leicht 
zum Feinde des Guten‘ werde, und er daher an der Zeit, auf irgendeine Nutzbarmachung des 
gesammelten Materials Bedacht zu nehmen“ 


Oppel starb am 27. April 1894, ohne seine Arbeit abzuschließen — seine originalen 
Aufzeichnungen bewahren den originalen ‚naiven‘ Charakter vor jeglichem Ver- 
such der Normalisierung und verbleiben ungekürzt, was sie zu einer unschätzbaren 
Quelle für die heutige Forschung macht. 

Nach Oppels Tod wurde sein Material dem Stadtarchiv übergeben. Die erste 
öffentliche Erwähnung ist in Askenasy (1904, 331) zu finden: 


„Das städtische Archiv besitzt seit kurzer Zeit ein umfangreiches Manuskript des Dr. phil. 
Oppel, in welchem derselbe das Material zu einer Grammatik der Frankfurter Mundart zu- 
sammengetragen hat. Dieses Manuskript ist leider zum Teil in einer vom Verfasser selbst 
erfundenen Geheimschrift niedergeschrieben, deren Entzifferung von einem seiner Schüler 
versucht werden soll.“ 


88 Hin gutes Beispiel sind von Oppel korrekt beobachtete Umlaut-Muster (vgl. Abschnitt 9.5.1.3 
auf S.321) oder die O-Formen für blau und grau (vgl. S.310), die er sich nicht erklären konnte. 
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n original üblich IPA Oppels „bedeutet der Laut“: 


1 a ä a rein, wieman (Hochdeutsch) in unserer Ge- 
gend ich sah ausspricht. 


2 üfa/a ä/ä ai zwischen a und ä, wie in / had, a bat. 

3 ä &/ä e/e: zwischen a und e in der Mitte, wie freilich 
in vielen Gegenden (und in vielen Dialekten 
auch bei uns) das e ausgesprochen wird. 

4 e &/e e/er rein, d. h. wie bei uns See, Weh. 

5 e/y - -  Mittelton zwischen e und i, wie das yin Twit- 
ty, happy (oft kann man von reinem e nicht 
unterscheiden). 

i i/i i/iz wie in sie, nie. 
ü = y in .dder Mitte zwischen i und u, wie in Mühe, 
Gemüse. Geht in vielen Dialekten in 9 über. 

8 u u/ü u/u: rein, wie in Uhu, du. 

9 ö & 9 zwischen ä und ö, ein sehr variabler Laut. 

10 ö - o zwischen o!? und ef. 

11 ä a/ä/ä/ä/dö 5/5: zwischen a und o. 

12 o 8/0 o/o: rein und tief (dunkel), wie in so, Noth. 

13 ü = —  Mittelton zwischen u und o. 


Tabelle 26: In Band 1, Faszikel 1, beschreibt Oppel seine Vokalnummern, n, wie hier 
dokumentiert (Datum unbekannt). Die Lautbeschreibungen sind mit Vorsicht zu ge- 
nießen, da nicht bekannt ist, in welchen Zusammenhang diese Norm, wenn überhaupt, 
Gültigkeitsanspruch hatte — so ist sie z.B. in einem scheinbar sehr frühen Heft zur 
Beschreibung des Aachner Dialekts und nicht des Frankfurterischen zu finden (womit 
auch nicht bekannt ist, ob sich das „bei uns“ auf Frankfurt bezieht). Oppels Frank- 
furter Vokale wurden behutsam auf IPA-Lautwerte übertragen, wobei zusätzlich die 
Zeichenverwendung im historisch-phonetisch-phonologischen Kontext herangezogen 
wurde (vgl. auch Tabelle 27 auf S.246 und im Detail dann Kapitel 9 ab $.283). 
Dabei wird der wichtige Kontrast zwischen (a), (a) und (ä) als auch zwischen (ä), 
(ä) und (e) berücksichtigt. Das Zeichen aus der Spalte ‚original‘ entstammt Faszikel 
1 und wurde so auch nur dort verwendet. Oppels übliche Schreibung ist die Kurrent 
der Zeit mit gegebenenfalls übergesetzter Vokalnummer (in dieser Arbeit aus satz- 
technischen Gründen unter dem Zeichen; 5 und 13 werden nie genutzt und sind im 
Folgenden fortgelassen; 7 und 10 spielen für Frankfurt keine Rolle). Oppels Nummern 
und Längenbezeichner, so vorhanden (im Original aber durchweg nicht so systema- 
tisch durchgeführt wie hier dargestellt), werden in dieser Arbeit exakt wiedergegeben 
(fortgelassen werden allerdings: die nur vereinzelt vorkommenden Nummerierung des 
E-Schwas mit ‚9°‘, hier vereinfacht: 9; die nur spärlich markierten Zwischentöne, wie 
z.B. aus 11 und 12: ‚112°, hier vereinfacht: 11; Betonungsmarkierungen). 
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aln)/äfn) 2(n) a 
aa a 2 l a a 


Tabelle 27: Einordnung der Oppel’schen Vokale in ein modernes IPA-Lautsystem. 
Links: Oppels Schreibweise mit Diakritika. Mitte: Nur Oppels Nummern. Rechts: 
Versuch einer Zuordnung auf IPA-Äquivalente bzw. Notation in dieser Arbeit. Im 
Wesentlichen stimmt Oppels Vokalinventar mit dem des Hochdeutschen aus Tabelle 
4 auf S.31 überein, doch einige Unterschiede fallen auf. So notierte Oppel vier A- 
Laute bzw. A-Qualitäten, das Hochdeutsche hat nur eine A-Qualität, IPA-[a]. Oppel 
hörte einen zusätzlichen dunklen A-Laut, den er mit (ä) notierte. Im 19. Jahrhun- 
dert entsprach (ä) lautlich dem offenen IPA-[>]. Im frühen 20. Jahrhundert war das 
dunkle A mehr dem neutralen [a] genährt und wird in dieser Arbeit, phonetisch- 
phonologisch motiviert, mit dem Lautzeichen [a] gedruckt (vgl. Abschnitt 9.4.1.1 
ab 8.307). Auch fällt auf, dass Oppel zwischen dem neutralen A, seinem (a), und 
einem nur langen, vermutlich helleren palataleren A, seinem (ä), unterschied, wobei 
dieses dem A aus Monophthongierung vorbehalten bleibt (vgl. Abschnitt 9.8.1 ab 
S.351). Oppels neutrales A, (a), wird hier mit IPA-[a] und das lange (ä) mit ei- 
nem palatisierten [a:] wiedergegeben. Verwirrend ist Oppels alternative Schreibweise 
des langen Monophthongierungs-A mit einem Ä-Graphem, also (ä), was damals in 
Frankfurt durchaus üblich war. Trotz Ä-Schreibung ist aber, durch die Vokalnum- 
mer 2 angezeigt, der Lautwert nicht Ä bzw. [e], was der Nummer 3 bedurft hätte 
(diese Ä-Grapheme werden in Abschnitt 9.8.1.5 ab $.358 diskutiert). Als viertes A 
kommt noch das lange nasalierte A hinzu, bei Oppel (ä(n)) oder (ä(n)), das hier in 
Anlehnung an das Französische mit [@:] wiedergegeben wird. Ferner sei darauf hinge- 
wiesen, dass Oppel in Normalposition nur jeweils einen I-, U- und O-Laut notierte, 
seine (i/u/o) (vereinzelt aber (o) für U und O vor R; vgl. Abschnitt 9.2.1 ab S. 287). 
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Im selben Jahr bezieht sich Hameran (1904, 2) in seiner Kritik zu Askenasy (1904) 
in der Frankfurter Zeitung auf „Oppels wertvolle Aufzeichnungen“. Erst Alexan- 
der Riese gelingt es, Oppels Geheimschrift zu brechen und würdigt ihn in einem 
Fachartikel (Riese 1920). Oppels Sammlung wurde von Hans Ludwig Rauh zwi- 
schen September 1939 und Juli 1940 auf 25.000 Zetteln verzettelt (vgl. Abschnitt 
7.2.7 ab S.253). Für Rauh hatte Oppels Forschung eine „Schlüsselstellung“* für 
die geplante erste Fassung des Frankfurter Wörterbuchs, wie er auf einer Notiz 
vermerkte (in: Schanze 1988, 17). Rauh erkennt in Oppel den „geradezu genialen 
Beobachter seiner Mundart“, als er die Aufzeichnungen zum ersten Mal öffentlich 
nutzt, um Frankfurter Schimpfnamen zu erläutern (Rauh 1941). Die verzettelte 
Version ist als Rauh/Bodensohn (1939-1945) im Frankfurter Stadtarchiv einge- 
lagert. Das Gleiche gilt für Oppels originale Faszikel (Oppel 1839-1894). Beide 
Quellen wurden für vorliegende Untersuchung zum Frankfurter Stadtdialekt nach 
Belegen durchgesehen. 

Oppels Material ist insofern herausragend, als dass es explizite Markierungen 
des Vokalklangs enthält, sehr umfangreich ist und vor allem kontrastiv arbeitet. 
Rauh wertete Oppels Material in einem Zeitungsartikel 1940 entsprechend hoch: 
„Da Oppel auch die Aussprache genau vermerkt hat, ist es möglich, genaue Kennt- 
nis des nicht mehr lebenden Frankfurter Wortschatzes zu erhalten und den Wandel 
der Mundart zu verfolgen“. In einem Brief im selben Jahr an die Höchster Mundart- 
sammlerin Frieda Reutling betonte er den, wie man heute sagen würde, Real-Time 
Charakter der Aufzeichnungen: 


„Die Oppel’sche Sammlung [ist] eine unschätzbare kritische Quelle, denn er hat nur das 
damals gesprochene und von ihm selbst gehörte oder von alten Leuten verbürgte Wort auf- 
gezeichnet.“ 


Ebenfalls 1940, in einem Brief an Professor Fritz Stroh, fügte Rauh hinzu: 


„[Oppel] fing etwa um 1839 mit seinen Beobachtungen und Aufzeichnungen der lebenden 
Mundart an und sammelte ein Leben lang. Da er auch eine genau ausgearbeitete phonetische 
Umschrift besaß, und die Aussprache der meisten Wörter mit dieser Umschrift kenntlich 
gemacht hat, so haben wir den seltenen glücklichen Fall vorliegen, daß wir die Entwicklung 
der Mundart über mehr als hundert Jahre genau zurückverfolgen können“ (beide Brief sind 
abgedruckt in: Schanze 1988, 57). 


7.2.3 Johann Matthias Firmenich-Richartz (1808-1889) 


In Firmenichs großer Mundartsammlung zu den deutschen Dialekten aus der Mitte 
des 19. Jahrhunderts, Germaniens Völkerstimmen, finden sich Frankfurt zugewie- 
sene Texte und ein paar einleitende Zeilen zum Lautstand des Frankfurterischen 
(Firmenich 1846b, 62). Wer Firmenichs Informanten zum Frankfurterischen wa- 
ren, ist nicht überliefert. Da insbesondere der Textblock zum Klang des A texti- 
dentisch mit dem Wörterbuch des Bürgercapitains ist, liegt es nahe, Malß anzu- 
setzen, zumindest als Schriftquelle. Eine andere Quelle war sicherlich Oppel. So 
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vermerkt dieser, dass er „einige Pröbchen derselben [Anm.: seiner Aufzeichnungen 
zum Frankfurterischen] an Dr. Firmenich in Berlin für dessen ‚Stimmen der Völker‘ 
übersandt“ hatte (Oppel 1869). 


7.2.4 Ernst Wülcker (1843-1895) 


Ernst Wülcker arbeitete an einer „Grammatik des Frankfurter Stadtdialects“, de- 
ren Manuskript jedoch verschollen ist (zu Wülcker: Alsheimer 1988, 18). Er stu- 
dierte in den 1870er-Jahren Frankfurter Urkunden und verfasste einen Fachartikel 
zum Frankfurter Stadtdialekt im Mittelalter (Wülcker 1877). Hauptsächlich trug 
er Belege aus der Zeit des Auftretens des frankfurterischen Deutsch als Amtsspra- 
che bis zum Wechsel auf ein überregionales Deutsch zusammen, was den Zeitraum 
von etwa 1330 bis 1500 betrifft. 

In dem Artikel finden sich aber noch einige wichtige Belege zum gesprochenen 
Frankfurter Stadtdialekt der 1870er-Jahre (Wülcker 1877, 29). Die Anzahl von 
14 Lautbelegen für A und drei für I erscheint gering. Jedoch sind die Lemmata 
sorgsam gewählt und sauber kontrastiv in Lautschrift niedergeschrieben. Wichtig 
ist auch, dass sie genau in die Zeit zwischen Oppel und Rauh fallen. In vorliegender 
Arbeit sind sie eingearbeitet, dem Frankfurter Wörterbuch fehlen sie. 


7.2.5 Die Frankfurter Wenkersätze (um 1880) 


Im Zuge der Erstellung des Sprachatlas des Deutschen Reichs schickte Georg Wen- 
ker im Winter 1879 seine 40 Wenkersätze, unter anderem auch an die Schulen in 
Frankfurt und Umgebung, mit der Bitte der Übersetzung in den lokalen Dialekt 
(zu Wenker: Schmidt/Herrgen 2011, 97-107). Im Fundus des Deutschen Sprach- 
atlas sind die entsprechenden Bögen zu Frankfurt (Nummer 27262), Bornheim 
(27257), Oberrad (27258), Sachsenhausen (27264) sowie Eckenheim (27268) erhal- 
ten (Wenker 1888-1923). Die Bögen wurden in Auswahl für vorliegende Arbeit 
in den Belegapparat eingearbeitet. Sie fehlen dem Frankfurter Wörterbuch. Für 
Frankfurt nahm die Allerheiligenschule in der Altstadt teil, die damals eine soge- 
nannte Dotationsschule war, also eine von der Stadt zu unterhaltende evangelische 
Kirchengemeindeschule (Dienst 2009, 83). Auf dem Wenkerbogen vermerkt der 
Lehrer Barsch, der aus Frankfurt-Hausen stammt, dass die Übersetzung von den 
Schülern gemacht worden sei und zur Schule: „wird meist von den Kindern der 
weniger bemittelten Klassen besucht“. In Tabelle 28 auf S.250 und 29 auf S. 251 
sind einige für die Dialektbeurteilung wichtige Wörter in Auswahl komparativ dar- 
gestellt. Es zeigt sich der damals noch vorherrschende unterschiedliche Lautstand 
zwischen Frankfurt und den Vororten deutlich®®. Die Wenkersätze sind allerdings 
nur eine singuläre Bestandsaufnahme genau einer Schulklasse, über deren Qualität 


8950 weisen z.B. Bornheim und Eckenheim noch den typisch zentralhessischen Rhotazismus 
auf, es wird (Werrer) für Wetter geschrieben. Frankfurt und Sachsenhausen schreiben dagegen 
(Wetter) und Oberrad (Wedder). 
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man heute nicht mehr urteilen kann: So muss die Aussprache nicht notwendigerwei- 
se homogen gewesen sein, der Lehrer mag unbewusst dialektale Formen verstärkt 
bzw. abgeschwächt oder sie missverständlich verschriftlicht haben”. Für Frankfurt 
ergibt sich die Problematik, dass gerade die Innenstadt, zu der besagte Frankfur- 
ter Schule gehörte, der Stadtteil war, an dem die meisten Zuwanderer wohnten. 
Rauh stellte 40 Jahre nach diesen Wenkersätzen fest „daß gerade die Altstadt, 
in der ehedem reine Mundart gesprochen wurde |...] heute ein mundartlich sehr 
unsicheres Gebiet ist“ (Rauh 1921a, 5). 


7.2.6 Alexander Askenasy (um 1900) 


Alexander Askenasy veröffentlichte 1904 mit seinem Buch Die Frankfurter Mund- 
art und ihre Literatur das erste Werk zum Frankfurter Dialekt im Buchumfang 
(Askenasy 1904). Der Autor sammelte in seinem Buch eine Vielzahl von Belegen 
aus der Mundartliteratur, insbesondere auch eher vergänglichen Druckwerken wie 
Kalenderblättern, Broschüren, Zeitungsartikeln usw. Allein seine annotierte Lite- 
raturliste beträgt fast hundert Seiten. Viele der originalen Werke sind im Krieg 
verbrannt und Askenasys Buch ist damit das einzig verbleibende Zeugnis. So ver- 
merkt auch Alsheimer (1988, 19), dass der „bibliographische Wert sehr hoch an- 
zusetzen“ sei. Allerdings bleibt wissenschaftlich das Buch hinter der Erwartung 
aus dem Titel zurück, denn es ist keine phonetisch-phonologische Beschreibung 
der Frankfurter Mundart. So war Asakenasy kein Germanist und dem Buch fehlt 
jegliche Struktur und Analyse des Lautstands, wie man sie etwa in einer zeit- 
genössischen Ortsgrammatik erwartet hätte. Seine Arbeit umfasst ausschließlich 
gedruckte Mundartquellen, der gesprochene Dialekt wird nicht untersucht. Ent- 
sprechend fällt die Kritik, so etwa von Hameran (1904) auch vernichtend aus: 


„soll ich es als einen Vorzug preisen, daß wir in diesen Tagen ein Buch über die Frankfurter 
Mundart von einem deutschen Landsmann nördlich der Mainlinie bekommen haben? Ja und 
nein. Ja — denn es ist äußerst interessant zu sehen, wie sich in jenen Köpfen die Frankfurter 
Welt malt. Nein — das Experiment ist verunglückt und es ist ärgerlich, daß der erste Schuß 
auf unsere Dialektscheibe [...] ein unheilbarer Fehlschuß ist.“ 


Als Rauh Oppels Material in den 1940ern auswertet, erkennt er, dass „Oppel zu- 
weilen wesentlich in den von Askenasy |...] gegebenen Erklärungen abweicht“. Auch 
er ist sehr „vorsichtig und kritisch“ gegenüber Askenasy und findet in Oppels Auf- 
zeichnungen die „größere Zuverlässigkeit“ (Rauh 1941, 13). 


90So findet sich z.B. in den Oberräder Wenkersätzen von 1880 eine starke Tendenz zu eher 
hochdeutscher Lautung in den Wörtern (alte, bald, kalte), was im Widerspruch zu der viel 
tiefergehenden Analyse in Freiling (1925) steht. Freiling notierte sowohl für 1925 als auch die 
‚alte‘ Generation durchweg die in Oberrad auch noch erwarteten zentralhessischen Formen 
(aale, baal, kaale) ohne Verschluss und mit langem A. 
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7.2.7 Hans Ludwig Rauh (1892-1945) 


Hans Ludwig Rauh promovierte 1921 mit seiner mehr als dreihundert Seiten star- 
ken Lautlehre der Frankfurter Mundart (Rauh 1921a). Das handschriftliche Werk 
ist eine klassische Lautlehre der Zeit: Der Lautstruktur des Westgermanischen fol- 
gend, werden die einzelnen Vokale und Konsonanten des Frankfurterischen erläu- 
tert und in vielen Belegen in Teuthonista-Lautschrift phonetisch transkribiert. In 
verschiedenen Anmerkungen wird das Frankfurterische gegen die noch zentralhes- 
sisch geprägte Sprache der Vororte abgegrenzt. Dem Sprachwandel wird Rechnung 
getragen durch Diskussion abweichender Aussprache bei der ‚alten‘ und ‚jungen‘ 
Generation. Damit existiert die Referenz für den Frankfurter Stadtdialekt. Rauhs 
Untersuchungen basieren, genauso wie bei Oppel siebzig Jahre vor ihm, auf dem 
gesprochenen Wort des Dialekts: „Meine Ausführungen stützen sich nicht auf die 
gedruckte Mundartliteratur, sondern sind das Ergebnis einer langen Beobachtung 
der augenblicklichen Sprachverhältnisse* (Rauh 1921b, 44). Rauhs Dissertation 
wurde nie gedruckt — publiziert wurde nur die Kurzfassung Rauh (1921b), die 
öfter für die einzig existierende Grammatik des Frankfurterischen gehalten wur- 
de?!. Rauhs Dissertation bzw. das darin niedergeschriebene Belegmaterial ist auch 
nicht in das Frankfurter Wörterbuch eingegangen (vgl. Abschnitt 7.2.8 ab S. 254). 
Das originale und einzige Exemplar der Schrift liegt heute im Frankfurter Institut 
für Stadtgeschichte. In vorliegender Arbeit wird sie in Auswahl zum ersten Mal 
gedruckt und komparativ ausgewertet. 

Zum Zeitpunkt seiner Dissertation kannte Rauh zwar Wülcker (1877), aber Op- 
pels Material noch nicht - es gibt keine Zitation oder Erwähnung. 1940 schreibt er 
in einem Zeitungsartikel zu Oppels Faszikeln: „Ein wertvoller Fund“ (in: Schanze 
1988, 57). Das ist wichtig: Damit erweist sich Oppels und Rauhs Material als unab- 
hängig voneinander durchgeführte Bestandsaufnahmen und Erläuterungsversuche. 

Als 1939 vom Frankfurter Oberbürgermeister die Forschungsstelle für das Frank- 
furter Wörterbuch geschaffen wurde, ging die Leitung an Rauh. Das Ziel war zu- 
sammen mit dem jungen Germanisten Heinz Bodensohn „den Wortschatz unserer 
Mundart zu sammeln und wissenschaftlich zu erforschen“ (abgedruckt in: Schanze 
1988, 57). Eine der wichtigsten Aufgaben war die Verzettlung von Oppels Materi- 
al. Schon 1937 und bis in die Kriegsjahre hinein führte Rauh Fragebogenaktionen 
durch, um den Stand der Mundart der 1930er- und 1940er-Jahre zu erfassen. Für 
das Frankfurter Wörterbuch begann Rauh etwa 1941 bis 1943 Frankfurter Ge- 
währsleute über die Frankfurter Mundart zu befragen. Die Aussprache notierte 
Rauh sauber handschriftlich in Teuthonista-Lautschrift auf Zettel und ergänzte 
Varianten und Kommentare. Diese Lautbelege sind in der Materialsammlung des 
Frankfurter Wörterbuchs enthalten, fehlen diesem aber im Druck. In vorliegender 


91So bewertet z.B. Veith (1983, 84) die Kurzfassung Rauh (1921b) als „unzulänglich“ und 
vermerkt, dass „weitere Untersuchungen nicht vorliegen“. Rauhs vollständige Dissertation wird 
nur von Schanze (1988) zitiert. Andere Arbeiten wie Broxten (1985) und Hock (2011) konnten 
nur die Kurzfassung nutzen. 
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Untersuchung zum Frankfurter Stadtdialekt werden sie berücksichtigt. Diese zwei- 
te Bestandsaufnahme des Frankfurterischen, 20 Jahre nach Rauhs Dissertation, 
ist die letzte Analyse des Frankfurter Stadtdialekts, bevor er endgültig aufhörte, 
als von den Vororten unterscheidbarer distinktiver Lautverband zu existieren (vgl. 
Abschnitt 7.3 ab S. 259). Der Krieg bereitete dem ersten Frankfurter Wörterbuch 
ein Ende: Bodensohn fiel 1943, Rauh verunglückte 1945 tödlich und große Teile 
der Belege und Arbeitsunterlagen gingen in den Kriegswirren verloren. Erst 1968 
wurden die Arbeiten zum Wörterbuch mit dem geretteten Material — was heu- 
te als Rauh/Bodensohn (1939-1945) im Frankfurter Institut für Stadtgeschichte 
eingelagert ist — wieder aufgenommen (vgl. Abschnitt 7.2.8 ab S. 254) 

Zu Rauh finden sich weitere Anmerkungen in Alsheimer (1988, 20-21) und 
Schanze (1988, 55-72). Rauh verfasste noch weitere Arbeiten zum Frankfurter 
Stadtdialekt, die aber von geringerer phonetisch-phonologischer Bedeutung sind 
(Rauh [1925], Rauh [1927], Rauh [1939] und Rauh [1941]). 


7.2.8 Das Frankfurter Wörterbuch (1971-1985) 


Der erste Versuch, ein Frankfurter Wörterbuch - im Folgenden abgekürzt: FWB - 
zu schaffen, wurde von Rauh unternommen, scheiterte aber am Zweiten Weltkrieg 
und seinem Tod (vgl. Abschnitt 7.2.7 ab S. 253). In den späten 1960er-Jahren nahm 
Wolfgang Brückner das Projekt zum Frankfurter Wörterbuch wieder auf??. 1988 
war das sechsbändige Werk abgeschlossen (FWB [1971-1985], Brückner [1971], 
Brückner [1972], Brückner [1976], Alsheimer [1988], Brückner [1988] und Schanze 
[1988]). Für das zweite FWB entschloss man sich aber, aus Kosten- und Aufwands- 
gründen, auf eine Neuerhebung von Belegen zu verzichten: Einzig das von Oppel 
und Rauh gesammelte Material sollte verwendet werden. Der ganze, nun im Frank- 
furter Institut für Stadtgeschichte abgelegte Apparat, umfasst 33 Zettelkästen und 
11 Kartons (Rauh/Bodensohn 1939-1945). 

Das zweite FWB in seiner Fassung von 1988 ist in erster Linie ein von Volks- 
kundlern verfasstes soziolinguistisches Werk, weniger ein sprachhistorisches oder 
phonetisch-phonologisches. Das FWB ist mit seinen Schriftbelegen unbestritten 
bedeutsam aus historischer und soziologischer Sicht — aber dem FWB gehen leider 
belastbare phonetische Belege ab, die gerade für die vorliegende Untersuchung mit 
dem VOKALJÄGER so wichtig sind. Diese Problematik soll im Folgenden erläutert 
werden, ohne die Leistung des Werks schmälern zu wollen. 

Das FWB beschreibt die frankfurterische Lautung in Teuthonista-Lautschrift 
und setzt diese in den Kopf des Artikels. Da jedoch eine exakte Rekonstruktion der 
Frankfurter Aussprache nicht zur Zielsetzung des FWB gehört, gilt die phonetische 
Umschreibung nur unter Vorbehalt: 


92Die Bearbeiter der einzelnen Bände des FWB sind: Bd.I (1971-1973): R. Alsheimer, R. 
Schanze; Bd. II (1974-1976): R. Schanze; Bd. III (1979-1981): H.-O. Schembs, G. Vogt; Bd.IV 
(1981-1983): H. Waibel, S. Herber, D. Struckmeier-Schubert, S. Herber, G. Vogt, W. Wintzer; 
Bd. III (1976-1979): R. Schanze, H.-O. Schembs; Bd. 6 (1983-1985): H.-O. Schembs, R. Schanze. 
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„Auf eine über die Zeichen der Zeitschrift für Mundartkunde hinausgehende Differenzierung 
der Laute musste verzichtet werden, auch wenn die ausgefeilte Phonetik im Oppel Manuskript 
Aufschlüsse in dieser Richtung geben könnte, denn sonst wäre die Einheitlichkeit gestört 
worden“ (FWB 1971-1985, 108). 


Die Teuthonista-Notation ist vom jeweiligen Bearbeiter „erschlossen“ und es ist 
leider nicht bezeichnet, ob sie auf einen und auf welchen Beleg sie gestützt ist. Der 
Leiter Wolfgang Brückner ist sich der Herausforderung bewusst und schreibt: 


„Ein Problem besonderer Art stellt unser phonetischer Ansatz der Mundartlemmas dar. Er 
steht [...| in eckigen Klammern, weist ihn also als von uns stammend aus und zwar nicht nur 
in seiner lautschriftlichen Wiedergabe [...], sondern vornehmlich als subjektive Setzung auf 
Grund in aller Offenheit zweifelhaft zu nennender Kriterien“ (Brückner 1976, 116). 


An anderer Stelle vermerkt er: 


„Ansonsten muss für allgemeine Aussagen zur Phonetik und Lautgeschichte des Frankfurte- 
rischen stets auf die ungedruckten Teile der Dissertation von Hans Ludwig Rauh verwiesen 
werden“ (Brückner 1972, VID. 


Die ungenaue Lautschrift des FWB lässt leider manches Detail verloren gehen. 
Oppel bezeugt z.B. explizit in seinem Faszikel OPF (1.19.8)” zu den frankfurte- 
rischen A-Lauten, dass der A-Klang in der Rahmen (Fenster) dunkles A ist, der 
in der Rahm (Sahne) „dagegen“ jedoch helles AP*. Darüber hinaus erscheint das 
Frankfurter Genus von Rahmen im Gegensatz zum Hochdeutschen weiblich: „die 
Rahm“ (OP: 11.31.10). Damit unterschied Mitte des 19. Jahrhunderts neben dem 
grammatischen Geschlecht der A-Klang die Bedeutung der beiden Worte. Der von- 
einander abweichende Vokalklang ist hier völlig regelmäßig und erklärt sich durch 
die entsprechenden historischen Referenzlaute des normalisierten Mittelhochdeut- 
schen (mhd). Der Rahm der Milch, [ra:m], korrespondiert mit mhd. roum, also mit 
dem alten Diphthong OU. Dieser wurde im Frankfurterischen stets zu hellem [a:] 
monophthongiert. Das dunkle [a:] in Rahmen, [ra:m], hingegen geht auf altkurzes 
A zurück, mhd. rame, welches durch Dehnung in offener Tonsilbe regelmäßig lang 
und dunkel wurde. Nun sind diese Belege auch im FWB abgedruckt - aber in der 
erschlossenen Lautschrift führt das FWB in den Artikeln zu Rahm und Rahmen je- 
weils beide Aussprachevarianten [ra:m] und [ra:m] undifferenziert nebeneinander 


97Zur Systematik der Siglen und phonetischen Transkription, vgl. Abschnitt 7.5.1 ab S. 264. 

94Dje unterschiedlichen A-Qualitäten bezeichnet Oppel mit seinen Vokalnummern - hier wird 
z.B. Rahmen unter der Nummer 11, dem dunklen A, geführt und in Faszikel OrF (1.52.15) 
erhält das A in der Rahm (Sahne) die Nummer 2 (vgl. auch Tabelle 27 von S. 246). Das an dieser 
Stelle auftretende helle A mit der Nummer 2 war vermutlich ein palatisiertes langes [ax], Oppels 
(ä), entstanden aus Monophthongierung der alte Diphthonge EI/OU/ÖU, was sich leicht von dem 
nur kurz vorkommenden neutralen A, (a), unterschied. Zu Rauhs Zeiten war der Unterschied 
verschwunden. Das deutlich dunklere A mit der Nummer 11 wird von Oppel als (ä) geschrieben. 
Der Lautwert dieses dunklen A entsprach zu Oppels Zeiten in etwa einem IPA-[5]. Um 1920 war 
der Laut nach dem A geneigt, was in dieser Arbeit phonologisch motiviert mit [a] gedruckt wird 
(vgl. Abschnitt 9.4.1 ab S. 306). In diesem Abschnitt über das FWB wird der Einfachheit halber 
das dunkle A durchgehend mit [a] und das Monophthongierungs-A mit [a] gesetzt. 
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an und die Vokalnummern fehlen”. Das mag vielleicht deskriptiv richtig sein, wenn 
sich mit dem Wandel der Stadtmundart beide Aussprachen mischten, ist jedoch 
sprachhistorisch unsauber: Der Bezug auf die Altlaute, hier alter Diphthong OU 
und altkurzes A in Dehnung, fehlt genauso wie die exakt differenzierende Doku- 
mentation der sich aus den Altlauten ergebenden Aussprache in kritischen Fällen 
wie diesen. Auch können im FWB für denselben Wortstamm unabgeglichene Laut- 
varianten in den verschiedenen Wortartikeln erscheinen. So hört z.B. Rauh Jagd 
mit dunklem [a] und Oppel jagen ebenso mit dunklem [ar], also [jaxt] und [ja:yo] 
(OPF, 1.19.7; RAu, 90.2.d). Das FWB führt nur helles [a] für Jagd an und nur 
dunkles [a] für jagen”. 

Das FWB hat keine Zeitkomponente in der Aussprachebeschreibung, womit 
naturgemäß ältere Dialektbelege völlig gleichrangig mit neueren halbmundartli- 
chen oder gar hochsprachlichen gestellt werden. Dies erschwert das Erkennen eines 
etwaigen Lautwandel zwischen der Zeit Oppels und Rauhs. 

Die in Teuthonista niedergeschriebenen Lautbelege aus Rauhs Dissertation 
wurden bemerkenswerterweise nicht in das FWB von 1988 eingearbeitet. Das mag 
darin begründet liegen, dass Rauh seine eigene Arbeit nicht verzettelt hatte und 
der Anspruch des FWB sich normativ auf Rauhs Zettelkasten beschränkte. Dieser 
enthält aber nur Rauhs spätere Belege aus den 1930er-Jahren. Zwar hat nachweis- 
lich die FWB-Bearbeiterin Rosemarie Schanze Rauhs volle Dissertation gekannt, 
doch schreibt der Leiter des FWB, Rauh habe „die Lautansätze seiner Lemma- 
ta, d.h. des gesamten Wörterbuchs, 1945 mit ins Grab genommen“ (Brückner 
1976, 117). Faktisch fehlt damit dem FWB und so der Öffentlichkeit die Fülle 
der präzisen Lautbeschreibungen aus Rauh (1921a). Das FWB gibt ebenso nicht 
die lauthistorisch wichtigen Lautbelege zum Frankfurterischen der 1870er-Jahre 
aus Wülcker (1877) wieder. In vorliegender Arbeit werden diese beiden Quellen in 
Auswahl nachgereicht. 

Als Rauh Oppels Arbeit verzettelte, übertrug er sorgsam die Vokalnımmern 
auf die Zettel des FWB, wo sie heute noch vorliegen. Oppels exakte Lautbeschrei- 
bungen, ausgedrückt mit seinen Nummern für verschiedene Vokalfarben, wurden 
nur fragmentarisch in das FWB eingearbeitet. Schanze (1988, 43) vermerkt, dass 
„diese Hinweiszeichen wenig beachtet“ wurden. Die Ungenauigkeit betrifft insbe- 
sondere die Unterscheidung des hellen [a] (Oppels Nummer 1) vom dunklen [a] 
(Oppels Nummer 11) sowie des offenen [e] (Oppels Nummer 3) vom geschlosse- 
nen [e] (Oppels Nummer 4). Zwar fallen Oppels Vokalnummern im Druck des 
FWB vollständig weg, doch ist der dunkle A-Klang , [a], der Nummer 11 im FWB 
oft durchscheinend, so denn Oppel das dunkle A als (a) handschriftlich notierte 
oder Rauh Oppel so verzettelte, was aber nicht einheitlich der Fall ist. So druckt 
2.B. das FWB Oppels „Staat ang&hät“ (etwa: herausgeputzte Kleidung tragen) als 


%]In der Teuthonista-Lautschrift des FWB wird [ram] als (ram) und [ram] als (ram) 
gedruckt. Die Einträge für Rahm (der Milch), kFra. [ram], sind (ram, ram, raim) sowie 
(ram, ram, räms, rame) für Rahmen, kFra. [rarm] (FWB, 2416-2417). 

%6]n der Teuthonista des FWB erscheint (jaxt, jagd) bzw. (jäxa); vgl. S. 1319. 
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„Stäät Aln)gehät“ womit der dunkle A-Klang mit dem Schriftzeichen (ä) angezeigt 
wird, obwohl das Diakritikum 11 im Druck fehlt (OPZ: 11.12.5). 

Unpräzise wird die Darstellung, wenn eine fehlende Vokalnummer auf eine 
falsche Aussprache schließen lässt: So dekliniert z.B. Oppel heilen als „ich häl, du 
hälst, er hält“ (OPZ:1.36.4). Aus dem Diakritikum 2 erschließt sich die Aussprache 
eindeutig zu [ha:lo, hazlst, ha:lt], was vollkommen regelmäßiges Monophthongie- 
rungs-A ist (verwirrend ist hier die Verwendung des Schriftzeichens (ä) für den 
Laut [a], obwohl dieses im Deutschen normalerweise den Ä-Laut [e] bezeichnet; 
zu dieser seltsamen Schreibung im Frankfurterischen vgl. auch Abschnitt 9.8.1 ab 
S.351). Das FWB setzt nun Oppels Beleg als „ich häl, du hälst, er hält“ und er- 
schließt daraus als Teuthonistaaussprache (halo), also [herlo]. Das ist aber falsch: 
Oppels Diakritikum 2 zeigt ja eben [a] und nicht [e] an, also [ha:lo]. Ein [e] bzw. 
offenes Ä hätte einer 3 bedurft””. 

Ein weiteres Problem ist der fehlende Kontext im Druck des FWB. Oppel klas- 
sifiziert etwa in seinem Faszikel zur Aussprache des A explizit langes dunkles [a:] 
in zwar, schreibt den Beleg aber dann als „zwar“ ohne jede weitere Lautmarkierung 
nieder (OPF: 1.19). Die Klangfarbe ergibt sich nicht aus der Schreibung, aber aus 
der Seitenüberschrift des Faszikels: „a“. Das FWB übernahm „zwar“ und erschloss 
falsches neutrales [a:], obwohl wir einen expliziten Lautbeleg mit dunklem [a:] ha- 
ben. Das dunkle A, [tsva:], ist auch hier völlig regelmäßig, da altlanges Ä in zewäre 
zugrunde liegt. 

Die eingeschränkte phonetisch-phonologische Dimension des FWB ist auch der 
Bearbeiterin Schanze wohl bekannt. Sie erkennt den Verlust der Vokalnummern 
als „Fehlerquelle“ an und bemerkt weiter: 


„Eine lautgerechte oder auch nur lautgetreue Umschreibung stößt auf Schwierigkeiten. Sie 
hängt zum kleinen Teil von der Mundartkompetenz des Bearbeiters und von Hinweisen in 
den Belegstellen ab, zum größten Teil beruht sie auf dem technischen Problem, dass der 
Nuancenreichtum der Vokale der Frankfurter Mundart durch die beschränkte Anzahl von 
Lautzeichen nicht dokumentierbar ist“ (Schanze 1988, 69). 


So erscheinen letztlich in der Druckfassung des FWB von 1988 keine originalen 
phonetischen Lautbelege®. 

Um phonetisches Referenzmaterial für den VOKALJÄGER zu finden, wurde auf 
den originalen Zettelkasten des FWB aus dem Frankfurter Institut für Stadtge- 
schichte zurückgegriffen (Rauh/Bodensohn 1939-1945). Dieser wurde für vorlie- 
gende Arbeit vollständig durchgesehen. Dort aufgefundene lautschriftliche Bele- 
ge, die der Druckfassung des FWB fehlen, werden hier berücksichtigt. Weitere 
Hauptquellen sind die originalen Handschriften Oppels und Rauhs, die ebenfalls 


"Vgl. auch Fußnote 94, S. 255. Der entsprechende Eintrag zum Ä-Laut im FWB ist (hälo) 
neben dem erwarteten A-Laut, (hälo), und hochdeutschem (hailo) (FWSB, 1121). 

98Drucktechnisch hätte dies durchaus bewerkstelligt werden können: In Riese (1920) erfolg- 
te dies z.B. mit einfachem Textsatz. Dort werden Oppels Diakritika als Ziffern in Klammern 
dem normalen Vokalzeichen nachgestellt: z.B. wurde ä als a(11) gesetzt. Eine weitere denkbare 
Ergänzung wäre der Abdruck der originalen Teuthonista-Lautbelege aus Rauh (1921a) gewesen. 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


258 Der Frankfurter Stadtdialekt 


durchgearbeitet wurden (Oppel [1839-1894] und Rauh [1921a]). Mit diesem Ansatz 
kann die Druckfassung des FWB hier in Auswahl phonetisch-phonologisch ergänzt 
werden. 


7.2.9 Eva Maria Brinkman to Broxten (um 1980) 


In ihrer Dissertation untersucht Eva Maria Brinkman to Broxten Mundartspre- 
cher des Neu-Frankfurterischen der 1980er-Jahre (Broxten 1985). Dazu führte sie 
Interviews und analysierte Tonbandaufzeichnungen von Stadtteilversammlungen. 
Ihre Arbeit enthält auch ohrenphonetische Transkriptionen, die in dieser Arbeit 
berücksichtigt und diskutiert werden. Ihr Schwerpunkt war es nicht, eine klassische 
Lautlehre zu schaffen: 


„Diese Abhandlung hat auch nicht zum Ziel, eine Systematik stadtmundartlicher Varietäten 
in Frankfurt zu erstellen, sondern sie will aus der direkten Sprachbeobachtung Erkenntnisse 
über Gebrauch und die Funktion von Stadtmundart heute gewinnen“ (Broxten 1985, 5). 


Ein Versuch der Erklärung der Frankfurter Lautphänomene durch Regress auf die 
Altlaute - mit Ausnahme der alten Diphthonge für das Monophthongierungs-A — 
wird nicht gemacht. Broxtens Ansatz folgt vielmehr dem Konzept der Phontaktik, 
wie es von Veith vorgeschlagen wurde, der übrigens auch zum Konsonantismus des 
Frankfurterischen publiziert hatte (Veith [1972] und Veith [1983]). Sie teilte das 
Frankfurterische in Stadtmundart I und Stadtmundart II ein, wobei erstere dem 
klassischen Vorkriegs-Frankfurterisch entspreche und letztere dem Lautstand der 
1980er. Ihre Gewährsleute bezeichnen sich als Sprecher des „Frankfurterischen“. 
obwohl es sich nach Broxten um „Neu-Hessisch“ handelt. Es scheint, dass weder 
Broxten noch Veith Oppels originale Materialien und Rauhs vollständige Disser- 
tation nutzen konnten. Dies mag darin begründet liegen, dass zu gleicher Zeit 
das gesamte Material in der Arbeitsgruppe des Frankfurter Wörterbuchs zusam- 
mengezogen war. Ein Kommentar zu Broxtens Dissertation findet sich in Herrgen 
(1988). 
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Es bietet sich für diese Arbeit an, die Zeit, für die phonetische bzw. lautmaleri- 
sche Belege vorliegen, in sechs Zeitphasen ab 1825 zu je 25 Jahren einzuteilen und 
den Quellen zuzuordnen. Idealtypisch wären die Belege einem mittelalten Sprecher 
der Periode zuzuordnen. Diese hier als Hauptperioden des Frankfurter Stadtdia- 
lekts bezeichneten Phasen entsprechen in etwa einer Generation bzw. einem Repro- 
duktionsintervall. Die Zuordnung ist willkürlich. Aber sie ermöglicht die zeitliche 
Referenzierung des Frankfurter Sprachwandels und alle Phänomene lassen sich in 
diesen Zeitscheiben analysieren. Eine Übersicht findet sich in Tabelle 30 auf S. 260. 
Dort sind sowohl Frankfurter Quellen als auch Quellen zu den Vorortdialekten auf- 
geführt. Abbildung 90 auf S. 261 zeigt die Einwohnerzahlen Frankfurts über diese 
Perioden. Auch sei hier nochmals auf Abbildung 87 auf S. 235 verwiesen, die die 
Ausbreitung Frankfurts in diesem Zeitraum darstellt. 

Wann genau Oppel welche Aufzeichnung gemacht hat, ist unklar, da die Hef- 
te selten datiert sind. Er ist 1815 geboren und starb 1894. Sein ältester Faszikel 
ist mit 1839 datiert und seine Hauptschaffenszeit scheint um 1850 zu liegen. So 
sei hier die unmittelbar vorausgehende Phase, 1825 bis 1850, als Hauptperiode 1 
bezeichnet. Sie fällt mit dem zusammen, was Oppel als alte Generation bezeich- 
net. Damit wird soziolinguistisch Hauptperiode 1 mit dem ‚Apparent-Time‘ (AP) 
Konstrukt erschlossen. Politisch ist das die erste Hälfte der Zeit der Freien Stadt 
Frankfurt, grob vom Ende der napoleonischen Besetzung 1813 bis zu den Unruhen 
von 1848. Frankfurt wächst moderat von ca. 40.000 Einwohnern 1810 auf 59.000 
1849. Hauptperiode 2 reicht dann von 1850 bis 1875. In diese Zeit fällt das Ende 
der Freien Stadt Frankfurt und die Annektierung durch Preußen 1866. Die Ein- 
wohnerzahl verdoppelt sich auf 103.000 im Jahre 1875. Hauptperiode 3 datiert von 
1875 bis 1900 und entspricht Oppels junger Generation (AP), fällt mit Wülckers 
Aufzeichnungen von 1877 zusammen und ist Rauhs alte Generation (AP) aus der 
Sicht von 1921. Das ist die Zeit des rapiden Wachstums der Stadt und des Mund- 
artdichters Friedrich Stoltze. Frankfurt hat 1900 nun 289.000 Einwohner, was das 
Dreifache der Vorperiode ist. 

Rauhs Dissertation zum Frankfurter Stadtdialekt von 1921 fällt in Hauptpe- 
riode 4, die hier von 1900 bis 1925 angesetzt wird. Hauptperiode 4 wird in dieser 
Arbeit als klassisches Frankfurterisch bzw. als Eichpunkt angesetzt. Auch diese 
Setzung ist willkürlich und nur durch die umfassende Datenlage in dieser Phase 
zu rechtfertigen. Daran schließt sich Hauptperiode 5 von 1925 bis 1945 an. Dies ist 
Rauhs junge Generation (AP), bezogen auf seine Arbeit von 1921 (ebenso sollen 
die Belege, die Rauh 1921 als „Halbmundart“ bezeichnete, hier einsortiert wer- 
den). Hauptperiode 5 ist Rauhs Zeit der Arbeit am Frankfurter Wörterbuch bis 
zu seinem Tod 1945, also die Sprache seiner Gewährsleute um 1940. Auch fällt 
in diese Zeit die Frankfurter Tonaufnahme aus dem Lautdenkmal reichsdeutscher 
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von bis HP wichtige Beiträge 
1200 1500 i Urkunden (vor Langvokaldiphthongierung) 
1500 1700 ii Urkunden (nach Langvokaldiphthongierung) 
1700 1825 0 älteste Mundartliteratur: unter anderem das Gedicht 
Malß 1833b: Wörterbuch zum Bürgercapitain (von 1821) 
* Geburt Oppels, 1815 
1835 1850 1 Oppels Sammlung (alte Gneation AP) nn 
Firmenich 1846a: Ausspracheanmerkungen 


* Geburt Wülckers, 1843 


1875 1900 3 Oppels Sammlung (junge Generation AP) 

Wülcker 1877: Belege 
Frankfurter Wenkersätze, um 1880 
Rauh 1921a: Lautlehre (alte Generation AP) 
Freiling 1925: Oberrad (alte Generation AP) 
* Geburt Rauhs, 1892 
T Tod Oppels, 1894 
T Tod Wüilckers, 1895 

1900 195 4 O©A. Müller: Mundartschwinke 
Rauh 1921a: Lautlehre der Frankfurter Mundart 
Freiling 1924: Frankfurt und Umgebung 
Freiling 1925: Oberrad 

1935 19455 5 Rauh 1921a: Lautlehre (junge Generation AP/Halbmundart) 
Rauhs Sammlung zum Frankfurter Wörterbuch 
© Das Frankfurter Lautdenkmal, 1937 
© andere Lautdenkmal- Aufnahmen, z.B. aus Klein-Gerau 
T Tod Rauhs, 1945 

1950 1975 6 © Wenkersätze einer Frankfurterin (mglw. L. Christ) 
Broxten 1985: Stadtdialekt (alte Generation AP) 
© REDE-Material (alte Generation AP) 


1975 heute 7 © REDE-Material 
Broxten 1985: Stadtdialekt 


Tabelle 30: Einteilung in die Vor- und Hauptperioden (HP) des Frankfurter Stadt- 
dialekts sowie die wichtigsten Beiträge. Quellen werden mehrmals eingetragen, wenn 
sie Apparent-Time (AP) Projektionen auf die ‚alte‘ oder ‚junge‘ Generation sind. 
© markiert Tondokumente. * Geburts- und } Sterbejahre der Frankfurter Forscher 
Oppel, Wülcker und Rauh sind bezeichnet. 
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Abbildung 90: Die Einwohner der Stadt Frankfurt (Kurve) und die Hauptperioden 
(Ziffern oben). Die Zählung beginnt mit 9.600 Einwohnern im Jahr 1387 und endet 
mit 717.624 für 2014. Die Zeit des stärksten Wachstums fällt in die Phasen zwischen 
1850 und 1925. Das sind die Hauptperioden 2 bis 4. Alle Einwohnerzahlen sind 
Volkszählungsergebnisse der statistischen Jahrbücher, zitiert nach Wikipedia. 


Mundarten von 1937 (vgl. Abschnitt 8.2.1 auf S. 276). 

Das Ende von Hauptperiode 5 ist die Zäsur des Zweiten Weltkriegs und das 
Ende der Zeit, die hier als klassisches Frankfurterisch benannt wird: Spätestens 
mit der Aufnahme von 170.000 Flüchtlingen aus dem Osten hörte Frankfurt auf, 
eine homogene sprachliche Einheit zu sein. Es schließen sich nach dem Krieg die 
Perioden 6 (1945-1975) und 7 (1975 bis heute) an, die als Neu-Frankfurterisch 
bezeichnet werden sollen. Periode 6 umfasst pauschal die Sprecher der älteren Ge- 
neration aus Broxten (1985) und des Regionalsprache.de (REDE) Materials (vgl. 
Abschnitt 8.2.2 auf S.276). Diese Sprecher hatten vermutlich noch Kontakt zu 
Personen, die den klassischen Frankfurter Stadtdialekt sprachen. Eine feinere Ein- 
teilung des Neu-Frankfurterischen ist auch mangels Belegen nicht zu rechtfertigen. 

Vor Oppel gibt es keine phonetischen oder lautmalerischen Aufzeichnungen 
vergleichbarer Qualität, wohl aber Anmerkungen zur Mundart, etwa von Malß um 
1820, und ältere Mundartdichtung wie Textors Prorector von 1794. Diese Vorpe- 
riode 0 wird von 1700 bis 1825 angesetzt. Damit reicht sie in die Zeit der ältesten 
Mundartdichtung zurück”. Für die Zeit davor gelte hier nur eine Grobeinteilung 
von etwa 1200 bis 1500 mit Vorperiode i. Dies ist die Zeit des Vorneuhochdeutschen 
und, nach Wülckers Vermutung, original frankfurterischen Stadtdialekts. Vorperi- 
ode i beginnt mit den ersten deutschen bzw. frankfurterischen Urkundenbelegen 
um 1200 und endet mit dem Übergang der Frankfurter Urkunden auf neuhoch- 
deutsche Schreibung. Vorperiode ii ist dann der verbleibende Zeitraum von etwa 
1500 bis 1700. 


99Obwohl die Texte, die vor dem Prorector erschienen, vermutlich nicht Frankfurterisch sind; 
vgl. hierzu Fußnote 85 auf S. 241. 
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7.4 Die Vororte und die Umgebungsdialekte 


Frankfurt liegt im Übergangsgebiet zwischen dem nördlichen Zentralhessisch und 
dem südlichen Rheinfränkisch. Die Umgebung und die Dialekteinteilung nach Wie- 
singer (1980, Karte 23 und 24) ist in Abbildung 91 auf S. 263 wiedergegeben. Der 
Norden und der unmittelbare Süden von Frankfurt gehören zum zentralhessischen 
Gebiet mit seiner nordwestlichen Ausprägung im Taunus, seiner nördlichen in der 
Wetterau und nordöstlichen im Hanauer Land. Im Süden finden sich die rheinfrän- 
kischen Ausprägungen des Starkenburgischen (Südosten) und Rhein- oder Südhes- 
sischen (Südwesten). 

Die schriftlichen Hauptquellen zu den Lauten der direkten Frankfurter Vororte 
sind Belege aus dem Fundus des Frankfurter Wörterbuchs, also Oppel (1839-1894), 
Rauh (1921a), Rauh (1921b), Heister (1925), Rauh/Bodensohn (1939-1945) und 
FWB (1971-1985). Allgemeines zur Mundart rund um Frankfurt zeichnete Frei- 
ling (1924) auf. In Freiling (1925) findet sich eine Abhandlung zur Mundart von 
Oberrad. Sie manifestiert in Wenkersätzen den Lautstand der 1920er und kontras- 
tiert ebenso mit Wenkersätzen den der ‚alten‘ Generation. Ein kleines Wörterbuch 
der Höchster Mundart ist mit Reuting (1922) erschienen und der Taunus wird in 
Schnellbacher (1963) behandelt. 

Das Zentralhessisch der Vororte bzw. der unmittelbaren Umgebung - im Fol- 
genden einfach: Zentralhessisch — bietet den kontrastiven Referenzrahmen für das 
Frankfurterische. 

Das Zentralhessisch der weiteren Umgebung ist beschrieben für Butzbach und 
die Wetterau in Alles (1953), für Friedberg in Reuß (1907), für Langenhain in 
Wagner (1917), für das Hanauer Land in Urff (1926), Siemon (1921), Siemon (1922) 
und Siemon (1939) und für das gesamte Gebiet in HNWB (1911f.) und Wiesinger 
(1970, Band I, $.120f., 251f., 328f. und 380f., Band I. $.36£., 167f. und 326.) 
sowie Wiesinger (1983a, 851-852) und Wiesinger (1983b, 1057). 

Das Rheinfränkische steht dem Frankfurterischen am nächsten und ist idealty- 
pisch für Kaulbach in Christmann (1927), für das Mainzer Land in Valentin (1934) 
und zusammenfassend in Wiesinger (1970, Band I, S. 114f£., 247 £., 325f. und 378f., 
Bd. II, S.33£., 156. und 321.) sowie Wiesinger (1983a, 846-849) und Wiesinger 
(1983b, 1057) beschrieben. Das Südhessische und Starkenburgerische südlich unter 
Frankfurt wird in Born (1938), Keller (1961, 161-199), Tischner (1968-2012) und 
SHWB (1965-1968) dokumentiert. 

Allgemeine, übergreifende Sammlungen, Lautlehren und Anmerkungen zu den 
Dialekten rund um Frankfurt finden sich in Firmenich (1846a), Vilmar (1883), Pfis- 
ter (1886), Reis (1908-1909), Maurer (1930), Wiesinger (1980) und Friebertshäuser 
(1987). Hessisch und Rheinfränkisch sind neben anderen deutschen Dialekten be- 
handelt in Schirmunski (1962). 
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Abbildung 91: Karte der weiteren Umgebung rund um Frankfurt (eigene Skizze 
nach Wiesinger [1980, Karte 23 und 24]). Eingetragen sind die dort erschlossenen 
wichtigsten Dialektgrenzen: die dick gepunktete Linie ist eine Grenze 1. Grades und 
die dünn gepunkteten Linien sind Grenzen 2. bis 4. Grades, wobei hier nur die wesent- 
liche Grobeinteilung nach Wiesingers Karte 24 wiedergegeben ist. Im Osten schließt 
sich außerhalb des sichtbaren Ausschnitts jeweils das Ostfränkische und im Nord- 
westen das Moselfränkische an. Frankfurt liegt in einem Übergangsgebiet zwischen 
Rheinfränkisch und Zentralhessisch. 
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7.5 Quellen und Schreibung 


7.5.1 Liste der Siglen und Quellen 


Belege werden mit einer kompakten kurzen Quellensigle zitiert, die in einer Tabelle 
alphabetisch dokumentiert sind: 


In dieser Tabelle werden folgende Codierungen und Abkürzungen verwendet: 


En 


Frankfurter Stadtmundart (F: Hauptfokus; f: Nebenfokus) 
Zentralhessisch der Frankfurter Vororte (Z: Hauptfokus; z: Nebenfokus) 
Südhessisch (S: Hauptfokus; s: Nebenfokus) 

Tondokumente (Typ 1 Quelle) 

Orts-/Gebietslautlehre (OLL bzw. GLL; Typ 2 Quelle) 

Sammlung oder Orts-/Gebietswörterbuch (Typ 2 Quelle) 

Abhandlung oder Notiz zur Mundart 

Literarischer Mundarttext (Typ 3 Quelle) 

Urkunde (Typ 4 Quelle) 


un 


nm N 
az» Seise 


Erläuterung der Spalten: Gegebenenfalls Markierung x für Hauptquelle und © für ein Tondoku- 
ment; Sigle der Quelle; Hauptperioden, aus denen die Quelle zeugt (P); Quelle; Markierung (M) 
für die in der Quelle abgedeckte(n) Mundart(en). 


Sigle P Typ Quelle M 

ASK 4 A Askenasy 1904: Die Frankfurter Mundart und ihre Li- F 
teratur. Subsiglen: FSt: Friedrich Stolze; StL: Friedrich 
Stoltzes Frankfurter Laterne. 

BAT 3. M Battenberg 1880: „Gedicht“. F 

Bo 3-5 LL Born 1938: Die Mundart in Darmstadt und seinem Um- 8 


land. Gedruckte GLL der Darmstädter Umgebung bis 
knapp unter Frankfurt, des mittleren Starkenburgs und 
bis nach Groß Gerau, Offenbach, Dieburg, Bensheim 
hinein. OLL von Darmstadt. Auffindereferenz ist der 
Abschnitt (8) des Buchs. 

123:70) 7 A Broxten 1985: „Stadtsprache — Stadtmundart — Stu- F 
die zum Gebrauch und zur Funktion mundartna- 
her Sprachvarietäten in Frankfurt am Main“. Dar- 
in: Impressionistisch-phonetische Transkriptionen des 
Frankfurterischen der frühen 1980er, S. 32-39 (vgl. Ab- 
schnitt 7.2.9, S.258f.). Sprecher A (SpA): um 1980 ca. 
50 Jahre alt, geboren in Frankfurt Bornheim und fällt 
somit in die Spätphase der Hauptperiode 5 bzw. Früh- 
phase der Hauptperiode 6; Sprecher B (SpB): geboren 
in Frankfurt und 1986 ca. 35 Jahre alt (somit: Hauptpe- 
riode 7); Sprecherin C (SpC): geboren im Sudetenland, 
1986 ca. 40 Jahre alt, seit ihrem 10. Lebensjahr in Frank- 
furt (somit: Hauptperiode 7). 

Fi 1 A,M Firmenich 1846a: Germaniens Völkerstimmen. (vgl. Ab- £,Z 
schnitt 7.2.3, S. 248f.). 
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Sigle P Typ Quelle 

O  FRAFx 7 TD Schmidt u.a. 2008f.: REDE: Regionalsprache.de. For- 
schungsplattform zu den modernen Regionalsprachen 
des Deutschen. Frankfurter Wenkersatzaufnahmen aus 
dem REDE-Korpus der 2000er-Jahre (vgl. Abschnitt 
8.2.2 ab S.276). FRAFz ist die Bezeichnung der Auf- 
nahme. 

O FraLD 5 TD Purschke 2014f.: Das Lautdenkmal. Frankfurter Laut- F 
denkmal von 1937 (vgl. Abschnitt 8.2.1 ab S.276). 

FR24 4 A Freiling 1924: „Über die Mundart rund um Frankfurt“.  f,Z 

FR25 34 A Freiling 1925: „Über die Mundart von Oberrad“. Auffin- f,Z 
dereferenz ist die Seite oder Wenkersatznummer, falls 
‚WS‘ vorangestellt ist. 

FWB 5 8 FWB 1971-1985: Frankfurter Wörterbuch. Druckform F,z 
(vgl. Abschnitt 7.2.8, S.254f.). Die Auffindereferenz ist 
die Spaltennummer. 

FWBZ i5 8 Rauh/Bodensohn 1939-1945: Materialsammlung Frank- f,Z 
furter Wörterbuch. Dem originalen Zettelkasten ent- 
nommen (vgl. Abschnitt 7.2.7, S. 253f.). 

Heı 458 Heister 1925: „Geschichte Bornheims“. Wenn die Auffin- f,Z 
dereferenz Zahl:Zahl:Zahl ist, bezieht sich das auf Band 
und Seite des FWB in Druckfassung sowie Seite des ver- 
schollenen Originals; sonst auf einen Zettel aus dem Fun- 
dus des FWB (Rauh/Bodensohn 1939-1945). 

© KGi/2 5 TD Purschke 2014f.: Das Lautdenkmal. Klein-Gerauer S 
Lautdenkmal-Aufnahmen von 1937, KG1 und KG2 (vgl. 
Abschnitt 8.2.1 ab S.276). 

MA(B) 0 MS  Malß 1833a: Die Entführung oder der alte Bürger- F,z 
Capitain. Insbesondere darin: Malß 1833b, „Wörterbuch 
zum Bürger-Capitain“ (vgl. Abschnitt 7.2.1, S. 242f.). 

*  OPrF 1-3 5 Oppel 1839-1894: Faszikel. Diese Belege sind Oppels F,z 

handschriftlichen, originalen Faszikeln entnommen (vgl. 
Abschnitt 7.2.2, S.242f.). Die Auffindereferenz ist co- 
diert als B.N.S, z.B. 1.19.1, wobei B für den Band steht, 
I oder II; N für die Faszikelnummer und $ für die Seite 
im Faszikel. Eine alternative Auffindereferenz ist B.S, 
wobei in diesem Fall $ die durchlaufende Seitenzahl des 
Bands B ist. 

* OPZ 1-3 5 Oppel 1839-1894: Faszikel. Diese Belege beziehen sich F,z 
auf Oppels Notizen in der von Rauh verzettelten hand- 
schriftlichen Fassung aus dem originalen Zettelkasten 
des ersten FWB (vgl. Abschnitt 7.2.2, S.242f.). Auf- 
findereferenz ist B.N.S, vgl. Eintrag OPF. 

OP 1-23 5 Oppel 1839-1894: Faszikel. Dieser Beleg ist aus der F,z 
gedruckten Fassung des FWB (vgl. Abschnitt 7.2.2, 

S. 242f.). Auffindereferenz ist B.N.S, vgl. Eintrag OPF. 
Falls ohne explizite Referenz, gilt der entsprechende Ar- 
tikel im FWB. 

* Rau 3-5 LL Rauh 1921a: „Die Lautlehre der Frankfurter Mundart“. F,z 
Die Auffindereferenz ist der Paragraph des handschrift- 
lichen Originals, z.B. 90.2.b steht also für 890.2.b (vgl. 
Abschnitt 7.2.7, 8.253.) 


IS 
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Sigle P Typ Quelle M 
RAUK 3-5 LL Rauh 1921b: „Die Frankfurter Mundart in ihren Grund- Fz 
zügen dargestellt“. 
RAUFB 5 58 Rauh/Bodensohn 1939-1945: Materialsammlung Frank- F 
furter Wörterbuch. Eingesandtes Fragebogenmaterial 
und verzettelt von Rauh (vgl. Abschnitt 7.2.7, S. 253f.). 
Rauz 5.58 Rauh/Bodensohn 1939-1945: Materialsammlung Frank- F 
furter Wörterbuch. Anderes Material zum FWB (vgl. 
Abschnitt 7.2.7, 8.253 £.). Die Gewährsleute für die pho- 
netischen Belege um 1940 waren insbesondere (mit Sigle 
in Klammern): Martha Wertheimer (MW), Georg Klein 
(GK), H. Winzinger aus Bornheim (WH) und Frau Heis- 
ter, 75 Jahre, aus Bornheim (H). 


RAu25 5 A Rauh 1925: „Zur Rhythmik und Melodik der Frankfurter F 
Mundart“. Vgl. Abschnitt 7.2.7, S. 253f. 

RAuU27 5 A Rauh 1927: „Der Frankfurter in Sprache und Dichtung“. F 
Vgl. Abschnitt 7.2.7, S. 253. 

SCHN 6 ILL Schnellbacher 1963: „Mundart und Landschaft des östli- Z 
chen Taunus“. Auffindereferenz ist der Abschnitt (8) des 
Buchs. 

STL 3 M,;5 Stoltze/Schalck 1860-1893: Frankfurter Latern. Auffin- F 


dereferenz ist der Jahrgang der Zeitung und die Seite. 
Teilweise der Druckfassung des FWB entnommen. 


TEP 0 M Textor 1887: Frankfurt wie es leibt und lebt. Hier Der M 
Prorector von 1794. 

URF 5 LL Urff 1926: „Mundart und Schriftsprache im Hanaui- Z 
schen“. Auffindereferenz ist der Abschnitt ($) des Buchs. 

VA 5  LL Valentin 1934: Geschichtlich-geographische Untersu- 7 


chungen zu den Mundarten rings um Mainz. Auffinde- 
referenz ist der Abschnitt ($) des Buchs. 

WS 358 Wenker 1888-1923: Der Sprachatlas des Deutschen 7Z,F 
Reichs. Wenkersätze zu Frankfurt und Umgebung. Auf- 
findereferenz ist die Nummer des Satzes. 

WüM i A Wülcker 1877: „Lauteigentuemlichkeiten des Frankfur-- F 
ter Stadtdialects im Mittelalter“. Mittelalterliche Bele- 
ge, gegebenenfalls ergänzt um die Jahreszahl der origi- 
nalen Quelle (vgl. Abschnitt 7.2.4, S. 249f.) 

* WÜF 3 A Wülcker 1877: „Lauteigentuemlichkeiten des Frankfur-- F 
ter Stadtdialects im Mittelalter“. Belege zum Frankfur- 
terischen um 1877, der Hauptperiode 3 (vgl. Abschnitt 
7.2.4, 5.249.) 


Direkt dem FWB unter entsprechendem Worteintrag entnommen sind Einzelbelege der Frank- 
furter Mundartdichtung aus folgenden Quellen bzw. Siglen (vgl. zu weiteren Informationen zu 
diesen Texten FWB, S.85-107): 

Bon®: Bohn, Franz J. Localpossen, 1882. Brr1°: Balser Breimund (d.i.: A. Delph), Die 
Sachsenhäuser, 1821. ET*: Karl Ettlinger, Kraut und Riewe, 1907. Fri?: Johann K. Friederich, 
Noch fünfzehn Jahre aus dem Leben eines Todthen, 1854. Frs®: Johann J. Fries, Humoristi- 
sche Balladen, 1897. HAKrE?: Adam Hamerans Anmerkungen zu Joseph Kehreins Volkssprache 
und Volkssitte in Nassau, 1872. Scuna°: Heinrich Schapper, Familie Hampelmann, 1880. STO?: 
Friedrich Stoltze, verschiedene Werke, 1848-1868. 
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7.5.2 Das Referenzsystem der Altlaute 


Für die Erklärung der Frankfurter Laute und ihrer Unterschiede etwa zum Zen- 
tralhessischen bietet es sich an, Referenzlautsysteme anzusetzen. Das eine ist das 
Hochdeutsche, das andere ist das in der Dialektforschung übliche Referenzsystem 
des ‚normalisierten Mittelhochdeutschen‘, abgekürzt ‚mhd‘!%. Es ist allerdings an- 
zuzweifeln, ob alle Referenzlaute des normalisierten Mittelhochdeutschen mit den 
durch die Buchstaben angedeuteten Lautwerten vollständig und überall existiert 
haben (Schmidt 2015). Zur Klassifikation, Bezug auf das Hochdeutsche und Sor- 
tierung eignen sich diese Referenzlaute aber durchaus. 

Die alten Referenzlaute — auch: Altlaute — werden hier in Kapitälchenschrift 
gesetzt, um ihren abstrakten Charakter zu markieren!"!. Die ursprünglich langen 
bzw. kurzen Vokale des normalisierten Mittelhochdeutschen werden in dieser Ar- 
beit einheitlich als altlang bzw. altkurz bezeichnet!”. 

Das Inventar der altkurzen Referenzlaute, der aus diesen entstandenen Deh- 
nungsvokale und der entsprechenden Umlaute ist mit Penzl (1989, 38): 


Kurzvokale Umlaute Dehnungsvokale Umlaute 
I U Ü 1: U Ü: 
E (6) (6) E! Oo: Ö: 
1D) Br 
A Ä A! Ä: 


Das Inventar der altlangen Referenzlaute und ihrer Umlaute ist: 


Langvokale Umlaute 
I Ü IU 
E Ö & 

Ä E 


Das Inventar der alten Diphthonge und ihrer Umlaute ist: 


Diphthonge Umlaute 
IE 1076) ÜE 
EI OU ÖU 


100Fine Alternative wäre das Westgermanische gewesen, wie etwa bei Rauh (1921a). 

101Dije Schreibung mit Großbuchstaben für alleinstehende Referenzlaute ist angelehnt an den 
Textsatz in Wiesinger (1964) und Wiesinger (1970). 

102Die Bezeichnungen in der Literatur sind unterschiedlich. Schirmunski (1962, 183 und 254) 
nutzt ebenso altlang, aber auch ursprünglich lang oder alte Länge. Weithin üblich, wie z.B. in 
Moser (1929), Wiesinger (1970) und Paul (2007) ist auch mhd. lang. 
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7.5.3 Lautbelege und phonetische Transkription 


Die Lautbezeichnungen sind in den originalen Handschriften völlig uneinheitlich — 
in dieser Arbeit wird behutsam auf IPA-Zeichen in eckigen Klammern [.] standardi- 
siert. Die Beziehung zwischen den handschriftlichen Lautzeichen und entsprechen- 
den Lautwerten der Vokale wird im phonetisch-phonologischen Teil in Kapitel 9 ab 
S.283 erläutert. Tabelle 32 auf S. 269 stellt vorausgreifend eine Übersicht vor. Das 
vollständige Lautinventar der Frankfurter Vokale wird im Ergänzungsabschnitt 
9.12 ab S. 409 zusammengefasst und lauthistorisch kontextualisiert. 

Originale phonetische Lautbezeichnungen, so insbesondere Oppels Diakritika- 
schrift und Rauhs Teuthonista, werden immer als Grapheme exakt zitiert - im 
Fließtext sind diese von geknickten Klammern (.) umfasst, so z.B. (a)'. 

Der Fokus liegt auf der Darstellung bzw. Rekonstruktion des betonten Frank- 
furter Stammvokals, Transkriptionen des Hochdeutschen zum Vergleich folgen aus- 
nahmslos der weiten Transkription aus Mangold (2005). Konsonanten bzw. phone- 
tische Schreibungen ganzer Wörter werden nur dann in standardisierter Form für 
das Frankfurterische aufgeführt, wenn dazu von Rauh aus Hauptperiode 4 exak- 
te Belege vorliegen oder ein Erschließen möglich erscheint — Tabelle 33 auf S. 270 
dokumentiert die in dieser Arbeit angesetzte kanonische Transkription der Frank- 
furter Konsonanten!"*. Auf die Rekonstruktion eines etwaigen konsonantischen 


103Djiese Schreibung mit (.) wird auch innerhalb von Zitaten durchgeführt, obwohl sie natürlich 
dem Original fehlt. Nicht phonetische Lautbezeichnungen als auch Lemmata werden ebenfalls 
künstlich mittels Kursivschrift in Zitaten hervorgehoben. 

104Dje IPA-Transkription der Konsonanten deutscher Dialekte ist alles andere als einheit- 
lich. Dies gilt insbesondere, weil die IPA keine standardisierte Form für die explizite Markie- 
rung des Gegensatzes zwischen Lenis und Fortis bei sonstiger Stimmlosigkeit kennt. Am Beispiel 
des D/T im Zürichdeutschen dokumentieren Fleischer/Schmid (2006, 245) acht unterschiedli- 
che akzeptierte Notationsvarianten — hier sei deren Methode 4 gefolgt, die für die Fortis das 
IPA-Zeichen des stimmlosen Konsonanten verwendet und für die Lenis das als stimmlos mar- 
kierte Zeichen des eigentlich stimmhaften Lauts nutzt. „Die Frankfurter Mundart kennt [...] 
im allgemeinen keine stimmhaften Verschluß- oder Reibelaute [...], d.h. sie ist stimmlos gewor- 
den. Je nach der Stärke des Ausatmungsdrucks werden sie als Fortis oder Lenis unterschie- 
den“ (Rauh 1921a, 94). Die stimmlosen starken Fortis-Laute des Frankfurter Stadtdialekts, in 
Rauhs Schreibweise (p/f/t/s/$/x/k), werden hier als [p/f/t/s/f/x/k] wiedergegeben, was der 
hochsprachlichen Konvention folgt (Rauh [1921a, 65-74] und Mangold [2005, 44]). Die stimm- 
losen schwachen Lenis-Laute, die dem Frankfurterischen eigen sind und dem Hochdeutschen 
fehlen, Rauhs (b/v/d/s/S/x/g), werden als [b/v/d/z/3/x/9] gedruckt. Die IPA-Markierung der 
Stimmlosigkeit mit untergesetztem Ring wird hier bei Unterlängen über dem Zeichen platziert, 
was ebenfalls Fleischer/Schmid (2006, 245) folgt. Rauhs konsonantische Lautbezeichnung ist in 
der Trennung von Fortis und Lenis nicht immer ganz einheitlich - im Zweifel wird dem in sei- 
nem konsonantischen Teil der Arbeit niedergeschriebenen Beleg gefolgt. Das leicht stimmhafte 
Frankfurter W, (w), wird als [v] gedruckt. Das Frankfurter R, Rauhs (r), war ein Zäpfchen-R (ur- 
sprünglich wohl aber ein Zungenspitzen-R), das sich bei stärkerer Artikulation durch „kraftvolles 
Rollen“ auszeichnete: Es wird hier mit [r] gedruckt (Rauh [1921a, 73] und Rauh [1921b, 51]). 
Das Frankfurter stimmhafte [j], Rauhs (j), trat noch in einer schwächeren I-Gleitlaut-Variante 
auf, die sich durch eine „nicht so deutlich wie bei j wahrnehmbare Artikulation“ auszeichnete, 
Rauhs (i) — hier soll sie mit [j] gedruckt werden. Die anderen Konsonanten [m/n/y/h/l] sind 
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Oppel Wülckr Rauh IPA- Anmerkungen 
um 1850 1877 1921 Laut Zu Details vgl. Kapitel 9 ab S. 283 


1/ı i/i i/iz geschlossenes I 
&/e e/&  e/er geschlossenes E 
ä € € kurzes offenes E 
ä & er langes offenes E 
ä/ä x/& ze/a: überoffenes E vor R 
-er ä &  vokalisiertes abschließendes -ER 
De a a kurzesnutrles A000 
ä ä a: langes neutrales A 
(a) a kurzes helles/palatisiertes A 
a/ä (&) ai langes helles/palatisiertes A 
ee ä 99 kurzes dunkles A (Periode 3 und davor) 
a a kurzes dunkles A (Periode 4) 
ä ao 3 9 langes dunkles A (Periode 3 und davor) 


ä a: langes dunkles A (Perioden 4-5) 


(0/0) /5  »/ar  geöffnetes O vor R und Konsonant 
(6) Ö 0: langes geöffnetes O vor R 
8/0 0o/ö  0o/or geschlossenes O 

u/ü u/ü u/ur geschlossenes U 

a o  E-Schwa: unbtontsE 00000 

-I- r/rl 8 A-Schwa: unsilbisches vokalisiertes R 

Te ai ar Diphthongaus And nn 
au au au  Diphthong aus A und U 
gi 97 Diphthong aus O und I (Periode 2) 


oi or  Diphthong aus O und I (Periode 4) 


Tabelle 32: Beziehung zwischen den handschriftlichen Vokalsymbolen der Mund- 
artforscher und den in dieser Arbeit angesetzten entsprechenden frankfurterischen 
IPA-Lautwerten (Schreibungen in Klammern sind selten; Notation hier mit allen 
Diakritika). Einzelheiten folgen dann in Kapitel 9 ab $.283 und der Ergänzungsab- 
schnitt 9.12 ab S.409 liefert eine übergreifende Beschreibung der Laute im histori- 
schen Kontext. Das dunkle Frankfurter A der späteren Zeit wird in dieser Arbeit aus 
phonologischen Gründen mit [a] gesetzt, hat aber in etwa den Lautwert von IPA-[>] 
mit Neigung zum A (vgl. Abschnitt 9.4.1.1 ab S.307). Man beachte insbesondere die 
verwirrende Vielfalt der originalen Schreibungen der E- und A-Laute. 
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Hochdeutsch Frankfurterisch 
IPA Rauh IPA 
Artikulations- "stimm- stimm- stimm- stimm- stimm- stimm-. 
ort los haft los haft los haft 
Lippen Fortis P p p/ph p/p" 
Lenis B b b b 
Lippen/ ee u (A Sunuan 
Zahn Lenis V V 
ee Lens W v w v 
Zn 0 Fortis Do ton Ye 
Lenis D d d d 
Fortis S s S s 
Lenis Z s Z 
Fortis SCH f 5 [ 
Lenis 3 5 3 
Vorder Deal: ae 
gaumen Lenis J J j/i j/) 
Hinter Forts K Br kkh oo 
gaumen Lenis G g g g 
Fortis aCH R x * 
Lenis x x 
Zahn" 00000000. Ber ee 
Zäpfchen-R R R 
Nase 000 ....ıM 000 mm mm 0000 m/m 
N n/n n/n n/n 
I NEEENEEEEFISHFEEEEFER 2) SOAEHEFEPENE:  EEHEERNEREENERN: EEE N; 
L iM ji Mm 
H h h h 


Tabelle 33: Beziehung zwischen den handschriftlichen Konsonantensymbolen 
Rauhs, den in dieser Arbeit angesetzten entsprechenden IPA-Lautwerten des Frank- 
furter Stadtdialekts sowie den hochdeutschen Vergleichslauten. Man beachte, dass 
die Reibe- und Verschlusslaute des klassischen Frankfurterischen nie, wie im Hoch- 
deutschen möglich, stimmhaft sind, sondern immer stimmlos auftreten, aber sowohl 
stark (Fortis) als auch schwach (Lenis). 
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Lautwandels des Frankfurter Stadtdialekts wird verzichtet. 
Die Belege sind in Blöcken gruppiert, was am besten an folgendem Beispiel- 
auszug erläutert wird: 


1l.AHtT > DP]P°- la + [a > hd.[al 
» gedacht. (gedäht). > [godaxt]”: OPF?, 1.19.7: ich dacht: ä&. > [godaxt]*: 
Rau“, 109.1: godaxt. > [Yodaxt]?: RAU, 110: a. © Sachsenhausen: D 
[godorxt]?: RAU?, 111: godöxt, „Von alten Sachsenhäusern habe ich geschlos- 
senes o gehört“. 


Das grobe Ordnungsschema folgt den Vokalen bzw. Folgekonsonanten des nor- 
malisierten Mittelhochdeutschen, z.B. „A-HT“ für das altlange A vor der mhd. 
Konsonantengruppe -HT (mittelhochdeutsche Bezugslaute erscheinen immer in 
Kapitälchen). Für die Gruppe ist dann nach dem Symbol „>“ die erschlossene 
Lautentwicklung zwischen den einzelnen Hauptperioden angegeben: So zeigt z.B. 
[>]? — [a]? einen Lautwandel von [>] in Periode 2 (1850-1875) zu [a] in Periode 4 
(1900-1925) an (vgl. Abschnitt 7.3 ab S. 259). Abschließend, nach der Markierung 
„> hd“, wird der Lautwert notiert, der sich im Hochdeutschen nach Mangold 
(2005) findet. Jedem Worteintrag (fett gesetzt) folgt die Form des normalisierten 
Mittelhochdeutschen in runden Klammern (kursiv gesetzt), dann die erschlosse- 
ne IPA-Aussprache des Frankfurterischen in eckigen Klammern nach dem Symbol 
D, gegebenenfalls ergänzt mit einer hochgestellten Ziffer um die erste Hauptpe- 
riode, für die dieser Lautwert galt (ohne Ziffer: Periode 4). Die konsonantische 
Schreibung folgt ausschließlich Rauh. Eine von Rauh für Hauptperiode 4 bezeugte 
oder sonst hervorzuhebende Aussprache wird fett gedruckt. Die einzelnen Belege 
in geneigter Schrift sind exakte Wiedergaben der handschriftlichen Originale. Die 
Einträge sind hinsichtlich einheitlicher Lautwerte gruppiert, chronologisch geord- 
net und den Hauptperioden zugeordnet, soweit dies möglich ist. Die Sigle bzw. 
Quellenangabe eines Belegs ist in Kapitälchen gesetzt und gegebenenfalls um eine 
Auffindereferenz und hochgestellte Hauptperiode ergänzt (vgl. Abschnitt 7.5.1 auf 
S. 264). So zeigt z.B. „OPF?, 1.19.7“ als Quelle Oppels originales Faszikel an und 
präzisiert: Band I, Heft 19, Seite 7 sowie Hauptperiode 2. In den Beleglisten er- 
scheinen die Schriftbelege zu Frankfurt zuerst, daran schließen sich gegebenenfalls 
die aus Sachsenhausen an und darauf folgen die der anderen Vororte, markiert mit 
dem Trennzeichen ©. In interessanten Fällen ist auch die Umlautform angegeben, 
was mit den Symbolen & und © markiert wird!®. 


vom Zeichen her gleich, wobei Rauhs nachgestelltes Aspirations-H, (h), hier als [?] gedruckt wird. 
Das Frankfurterische kannte noch die silbischen (m/n/l), die als [m/n/l] wiedergegeben werden. 
Konsonanten in hochdeutschen Beispiele erscheinen in der weiten Notation von Mangold (2005). 

105Dabei wird gegebenenfalls mit den üblichen Abkürzungen ergänzt: Dim.: Diminutiv; Pl.: 
Plural; Sing.: Singular. 
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Kapitel 8 


Frankfurter Tondokumente 


Zusammenfassung: Die mit dem VOKALJÄGER untersuchten Tondokumen- 
te zum Frankfurter Stadtdialekt und den Umgebungsdialekten werden vor- 
gestellt. Das wichtigste Tondokument ist die Frankfurter Aufnahme aus dem 
Lautdenkmal reichsdeutscher Mundarten von 1937, das Frankfurter Lautdenk- 
mal, und damit ein Zeugnis des originalen Frankfurter Stadtdialekts kurz 
vor seinem Untergang 1945. Weiteres Audiomaterial ergänzt die Untersu- 
chung zum Frankfurterischen. Dazu gehören Lautdenkmal-Aufnahmen aus 
der Frankfurter Umgebung und Frankfurter Tonaufnahmen der Wenkersätze 
aus dem REDE-Projekt aus den 2000er-Jahren. 
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8.1 Einführung 


8.1.1 Dialektalitätsmessung mit dem VokalJäger 


Die messphonetische und klassifikationsphonetische Untersuchung von Dialektauf- 
nahmen ist der eigentliche Nutzeinsatz des VOKALJÄGERs. Technisch werden da- 
bei die Prozessschritte der Messphonetik (vgl. Abschnitt 3.7, S.103£.) und der 
Klassifikationsphonetik (vgl. Abschnitt 5.5, S. 213f.) durchlaufen. 

Der Idee folgend, dass der VOKALJÄGER ein phonetisches Werkzeug für den 
Dialektphonologen sein soll, wird der VOKALJÄGER hier ebenso genutzt: Die klas- 
sifikationsphonetischen Ergebnisse für den Frankfurter Stadtdialekt im Detail fin- 
den sich an entsprechender Stelle im phonologischen Teil der Arbeit in Kapitel 9 
ab S. 283. Das vorliegende kurze Kapitel 8 stellt die mit dem VOKALJÄGER unter- 
suchten Tondokumente vor und bietet einen Überblick über die Gesamtstatistik. 

Untersucht wurden mit dem VOKALJÄGER historische Lautdenkmal-Aufnah- 
men aus Frankfurt und Umgebung (Abschnitt 8.2.1 ab S.276) sowie die Wenker- 
sätze aus dem Frankfurter REDE-Material (Abschnitt 8.2.2 ab S. 276), ergänzt um 
eine Aufnahme dieser Sätze von einer unbekannten Frankfurter Mundartsprecherin 
(Abschnitt 8.2.3 ab S. 277). Eine Übersicht findet sich in Tabelle 34 auf Seite 275. 


8.1.2 Messphonetik und deutsche Dialekte 


Es gibt einige mess- bzw. experimentalphonetische Untersuchungen zu den Voka- 
len der deutschen Dialekte. Vielen ist ein Kapitel gewidmet oder sie finden sich als 
Beilage in einer Ortsgrammatik. Im Folgenden ist eine Auswahl der Arbeiten aufge- 
führt, die empirische Formant-Untersuchungen zum Vokalismus deutscher Dialekte 
beinhalten und für vorliegende Arbeit gesichtet wurden. 

Heike (1964, 53-117) führte eine akustische Merkmalsanalyse der Stadtkölner 
Mundart durch. Diese Analyse und andere aus der Anfangszeit der Experimen- 
talphonetik erfolgten noch elektrisch mit einem Sonographen. Göschel (1973, 205- 
238) vermaß Formanten in Orten der niederdeutsch-ostfälischen, der mitteldeutsch- 
nordthüringischen und der mitteldeutsch-erzgebirgischen Dialektgruppen. Bei Haas 
(1978, Anhang, Abbildung 19) sind die Formanten für luzerndeutsche Vokale auf- 
geführt. Moosmüller (2007) und Moosmüller (2010) behandeln das österreichische 
Deutsch. Moosmüller nutzte moderne digitale Verfahren. Kleber (2011) untersuch- 
te das Mittelbairische und das Obersächsische. Gackstatter/Niebuhr (2012) ana- 
lysierten die Langvokale im Niederdeutschen. 

Mit der Dissertation von Broxten (1985) existiert eine auditiv-phonetische Un- 
tersuchung Frankfurter Tondokumente. Diese Arbeit enthält allerdings keine pho- 
netischen Ergebnisse wie etwa Formantstatistiken. 
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Sigle Typ Jahr Dialekt A G HP Ph VJ 
FraLD LD 197 _kEra 3 m 5 x 
Fall ww nFra mittel w 6000 x“ 
FraF1 RE 2008? nFra mittem 7 x 
FraF2(L) RE 20090 nFra mittelm 7 x x 
Fraf3L) RE 2013 nFfraa mittelm 7 x x 
FraF4AL) RE 2013 nFfra mittelm 7 x x 
FraFAl(L) RE 2009 nFra älter m 6 x x 
FraFA2(L) RE 2000 nFfra älter m 6 x x 
FraFJ1 RE 2013 nFra jünger m 7 “x 
KG ID 937 Hs 9 .m5 x“ 
KG2 LD 197  SHes 36 m 9 * 


Tabelle 34: Übersicht über die mit dem VOKALJÄGER untersuchten Tondokumente. 
Typ LD: Lautdenkmal, WS: Wenkersätze, RE: Wenkersätze aus dem REDE-Mate- 
rial; Aufnahmejahr, falls bekannt; Dialekt: klassisches Frankfurterisch (kFra), Neu- 
Frankfurterisch (nFra), Südhessisch aus Klein-Gerau (SHes); wobei bei FraFA1! die 
Zuordnung fragwürdig ist (vgl. Abschnitt 9.11 ab S.398); A: Alter oder Altersgruppe; 
G: Geschlecht; HP: Hauptperiode; Ph: markiert Aufnahmen aus dem REDE-Mate- 
rial, für die phonetische Transkriptionen vorliegen; VJ: markiert die Aufnahmen, die 
mit dem VOKALJÄGER phonetisch-phonologisch vermessen wurden, wobei aus dem 
REDE-Material die (L)angfassungen genutzt wurden. 
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8.2 Frankfurter Tonmaterial 


8.2.1 Das Frankfurter Lautdenkmal 


Das Frankfurter Lautdenkmal gehört zu einer Sammlung von etwa 300 Tonauf- 
nahmen deutscher Dialekte, die Bernhard Martin 1937 im Auftrag des nationalso- 
zialistischen Regimes erstellte. Das Lautdenkmal reichsdeutscher Mundarten, ur- 
sprünglich als Geschenk für Adolf Hitler konzipiert, ist für die moderne Sprachwis- 
senschaft von großer Bedeutung. Schmidt/Herrgen (2011, 117) benennen es als das 
„früheste flächendeckend erhobene“ Tonmaterial zu den deutschen Dialekten. Das 
Lautdenkmal liegt nun digitalisiert beim Forschungszentrum Deutscher Sprachat- 
las in Marburg vor. Die Lautdenkmal-Aufnahmen aus Frankfurt und Umgebung 
wurden von Prof. Dr. Jürgen Erich Schmidt und Dr. Christoph Purschke zur Ver- 
fügung gestellt. Dr. Purschke arbeitet zurzeit an einer wissenschaftlichen Edition 
des Lautdenkmals (Purschke [2014 £.] und Purschke [2012]). Weitere Informationen 
zum Lautdenkmal im Allgemeinen finden sich auch in Näser (2001 £.). 

Die Frankfurt zugeordnete Aufnahme, im Folgenden: das Frankfurter Lautdenk- 
mal, trägt die Nummer MD-17 und wurde am 22.04.1937 in Berlin aufgenommen. 
In ihr berichtet der 38-jährige Frankfurter Postassistent und NSDAP-Mann R. J. 
begeistert von der Machtergreifung 1933. Der faschistische Inhalt ist belanglos und 
soll hier nicht weiter behandelt werden. 

Sprachhistorisch jedoch ist die knapp über 3 Minuten lange Aufnahme für die 
Erforschung des Frankfurterischen von großer Bedeutung, denn sie erbringt Belege 
für einen Zeitraum, der bisher noch nicht messphonetisch erfasst wurde. 

Weitere Lautdenkmal-Aufnahmen aus der Frankfurter Umgebung liegen für 
60117 Berstadt bei Büdingen (MD-10: 1 Sprecher); 60121 Meerholz (MD-11: 2 
Sprecher); 65307 Bad Schwalbach, ehemalig Langenschwalbach (MD-14: 1 Spre- 
cher) und 60120 Klein-Gerau (MD-15: 2 Sprecher) vor. Mit dem VOKALJÄGER 
untersucht wurden das Frankfurter Lautdenkmal (FraLD) und die beiden Spre- 
cher aus dem Lautdenkmal aus Klein-Gerau (KGl, KG2). Sie fallen nach dem 
zeitlichen Klassifikationsschema dieser Arbeit in Hauptperiode 5 (1925-1945), die 
die letzte Periode des Frankfurter Stadtdialekts darstellt. Die Lautdenkmal-Auf- 
nahmen wurden vom Autor selbst händisch segmentiert. 


8.2.2 Das Frankfurter REDE-Material 


Im Rahmen des Projekts Regionalsprache.de (REDE) werden seit 2008 unter ande- 
rem auch Wenkersätze aufgenommen (Schmidt u.a. [2008 £.| und Schmidt/Herrgen 
[2011, 375-392]). Dazu gehören sieben Sprachaufnahmen, die Frankfurt bzw. dem 
Neu-Frankfurterisch der Hauptperioden 6 und 7 der Nachkriegszeit zugerechnet 
werden. Pauschal sind hier die älteren Sprecher der Periode 6 (1945-1975) und 
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die jüngeren der Periode 7 (1975 bis heute) zugewiesen. Für die Untersuchung mit 
dem VOKALJÄGER tragen die REDE-Aufnahmen die Siglen FraFl bis FraF4 so- 
wie FraFAl, FraFA2 und FraFJ1, wobei die letzteren nach dem Alter der Sprecher 
in ‚jung‘ und ‚alt‘ gruppiert sind. Die Aufnahmen wurden 2008 bis 2013 von den 
Marburger Exploratoren Schaub, Meinck und Vorholz erstellt. 

Die Aufnahmen existieren in zwei Versionen: Zum einen in einer geschnittenen 
Kurzfassung, die von Prof. Kehrein zur Verfügung gestellt wurde und für die ei- 
ne ohrenphonetische SAMPA-Transkription von der Marburger Wissenschaftlerin 
D. Uebersohn durchgeführt wurde. Diese Version wurde für die Tests des gleitenden 
Merkmals in Abschnitt 6.2, S. 226f., verwendet. Die ungeschnittene Langfassung 
stammt aus dem REDE-Korpus und ist hier mit einem nachgestellten L markiert. 
Sie enthält Wiederholungen, freie Rede und insgesamt mehr Lautproben, was ihre 
statistische Signifikanz erhöht. Die Probenzahl konnte so um etwa 30% gesteigert 
werden. Die Langfassung ist die Version, welche in die phonetisch-phonologischen 
Untersuchungen mit den VOKALJÄGER in Kapitel 9 ab $. 283 einfließen!?®. Die 
Langfassungen wurden vom Autor händisch segmentiert. 


8.2.3 Die Wenkersätze einer Frankfurter Sprecherin 


In Marburger Tonarchiv liegt eine nicht näher datierte Aufnahme der Wenkersätze, 
gesprochen von einer unbekannten Frankfurter Sprecherin (FraLC). Nach Auskunft 
der Marburger Exploratoren handelt es sich hierbei vermutlich um die bekannte 
Frankfurter Mundartsprecherin und Volksschauspielerin Liesel Christ (1919-1996). 
Näheres ist zu der Aufnahme leider nicht bekannt. Für den VOKALJÄGER ist 
diese Aufnahme insbesondere deshalb interessant, da dies die älteste weibliche 
Dialektaufnahme in einer guten Tonqualität ist. Der Aufnahmezeitpunkt ist leider 
nicht genauer bekannt — hier wird die Aufnahme der Hauptperiode 6 (1945-1975) 
zugeordnet, also den älteren Sprechern des Neu-Frankfurterischen. Problematisch 
ist sicherlich, dass Frau Christ Mundartschauspielerin war. So ist nicht bekannt, 
wie stark ihre mundartliche Prägung für die Bühne ‚erlernt‘ ist. Die Aufnahme 
wurde vom Autor händisch segmentiert. 


8.2.4 Weiteres Tonmaterial aus Frankfurt 


Es existieren weitere Aufnahmen, zum Teil mit niedriger Aufnahmequalität, die 
noch nicht mit dem VOKALJÄGER untersucht wurden. 

Die ältesten mit Frankfurt in Bezug stehenden Tonaufnahmen sind von 1907. 
Hierbei handelt es sich um vier Schwänke in Frankfurter Mundart mit Orche- 
sterbegleitung, die auf Edison Goldguss-Walzen aufgenommen wurden (Nr. 15: 
569, 581, 606, 618). Eingesprochen wurden sie von dem Humoristen Adam Müller 


1063 existiert noch eine Aufnahmen FraF5, die aber wegen eines zu geringen Lautstärkepegels 
ausgeschlossen wurde. Von FraF1 liegt keine Langfassung vor - sie wurde wegen der geringen 
Probenzahl ausgeschlossen. 
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(1863-1932), genannt Das Millerche. Müller nahm bis 1925 mindestens noch zwölf 
Schallplatten auf. Alle Aufnahmen liegen mittlerweile in exzellenter Tonqualität 
digitalisiert vor (Müller 1907-1925). Die Dialektalität ist naturgemäß in diesen 
Mundartaufnahmen extrem ausgeprägt. Problematisch ist allerdings, dass Müller 
kein gebürtiger Frankfurter war. Er ist in Somborn bei Fulda im Nordhessischen 
geboren und kam erst 1878 als Geselle nach Frankfurt (Konopatzki 2012). Schon 
früh trat er auf kleinen Frankfurter Vereinsbühnen auf. Auf dem Höhepunkt seiner 
Laufbahn Ende der 1920er bespielte er die großen Variet&bühnen der Stadt. Mül- 
lers Frankfurter Dialekt ist somit vermutlich erlernt, kann aber durchaus, gerade in 
seiner Künstlichkeit und Überzeichnung, als reproduzierendes ‚Abbild‘ des dama- 
ligen Stadtdialekts gelten. Dabei gingen allerdings Feinheiten verloren, wie z.B., 
dass sein Protagonist, der Äbbelwoibalser, als gebürtiger Sachsenhäuser eigentlich 
Frankfurterisch mit deutlich zentralhessischerem Einschlag hätte sprechen müssen. 

Das Institut für Stadtgeschichte Frankfurt am Main besitzt verschiedene, ver- 
mutlich in der 1920ern aufgenommene Schallfolien von Frankfurter Sprechern und 
Sprecherinnen (Siglen ISG S12B 72-76). Nr. 74 hat deutlich Frankfurter Prä- 
gung, ist allerdings sehr schlecht erhalten. Die anderen Aufnahmen sind weniger 
stark dialektal. Des Weiteren liegen in den Tonaufnahmen Hessischer Mundarten 
sechzehn Frankfurt zugeordnete digitalisierte Wenkersatzaufnahmen vor (Siglen 
TAHM 2130, 2156 und 2167). 
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8.3 Messphonetische Gesamtstatistik 


Dieser Abschnitt liefert nur kurze Übersichtsstatistiken, wie sie in den Dialekt- 
proben gemessen wurden. Tabelle 35 auf S. 280 zählt die Lautproben pro Dialekt- 
sprecher. Alle vorhandenen Proben werden zur Normalisierung genutzt, doch nur 
eine Untermenge historisch-phonologisch interessanter Gruppen wird in Kapitel 9 
ab S. 283 untersucht. Dort und in den dazugehörigen Anhängen findet sich auch 
die vollständige Dokumentierung der Gruppen sowie die phonetisch-phonologische 
Diskussion von Einzelphänomenen. 

Die Abbildungen 92 auf S.280 und 93 auf $.281 zeigen die Häufigkeitsver- 
teilungen der ersten beiden Formanten vor Normalisierung und zwar für das mit 
dem VOKALJÄGER phonetisch-phonologisch untersuchte Dialektmaterial. Einzel- 
ne hochdeutsche Aufnahmen aus HG1 und HG2 sind zum Vergleich zugefügt. Sehr 
deutlich sind die erheblichen Unterschiede in den Verteilungsmustern zu erkennen. 
Manche F2-Verteilungen wie z.B. für FraLD haben einen relativen ‚Buckel‘ zur 
Rechten bzw. eine Ausdünnung zur Linken — dieser ist eine Verzerrung, die durch 
eine vergleichsweise geringe Segmentierung, und damit Population, zentraler un- 
betonter Schwavokale in diesen Proben bedingt ist. Ein anderer Grund sind die 
fundamental verschiedenen Laut- bzw. Worthäufigkeiten: Während die Berliner 
und Marburger Sätze aus HG1 und HG2 jeweils identische Verteilungen haben, ist 
dies bei den Wenkersätzen in der hier verwendeten Langfassung weniger der Fall. 
Die Lautdenkmal-Aufnahmen sind im Wesentlichen freie Rede und weisen völlig 
unterschiedliche Verteilungen auf. 

Diese und andere Abweichungen zu den Referenzverteilungen aus HG1 zeigen 
anschaulich die dringende Notwendigkeit einer Formantnormalisierung, die robust 
gegenüber solchen Verzerrungen ist. Nur mit der robusten Methode des VOKALJÄ- 
GERS aus Abschnitt 3.6, S. 84£., war es überhaupt möglich, Messdaten zu ermitteln, 
die sich für die Klassifikationsphonetik mittels gleitender Merkmale eignen. 
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Sprecher gesamt untersucht 


FraLD 430 305 
KG1 359 208 
KG2 101 68 
Fall 37: 213° 
Fafl a 215 
FraF2L 416 278 
FraF3L 536 378 
FraF4L 385 256 
FraFAlL 460 299 
FraFA2L 418 272 
Summe 3.769 2.492 


Tabelle 35: Anzahl der Lautproben pro Dialektsprecher. Mit dem VOKALJÄGER 
untersucht wurde die Untermenge, die sich aus den ausgewählten phonetisch-phono- 
logischen Dialektmustern aus Kapitel 9 ab $. 283 ergibt. 


an 
N 
< 
IL 

So 
IL 


K61MR 
FraFJ1 
K65BE 
FraF4L 
KG2 
FraF3L 
FraLD 
KO1BE 
FraF2L 
FraFA1L 
K07MR 
KG1 
FraLC 


Abbildung 92: Geschätzte Häufigkeitsverteilung der originalen F1-Werte vor Nor- 
malisierung (durchgezogene Linie oben und unten: Mittelwerte des unteren und obe- 
ren Perzentilmittels; gestrichelte Linie: Mittelwert der Perzentilmitten, bezogen auf 
HG1). In Hellgrau gezeichnet sind zum Vergleich hochdeutsche Proben aus HG1 und 
HG2. 
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FraFA2L - 


FraF3L 


K65BE - 


KG2 - 


FraLD - 


FraF2L - 


KG1- 


KO1BE - 


K07MR - 


K61MR - 


FraF4L- 


FraLC - 


FraFA1L - 


FraFJ1 - 


Abbildung 93: Geschätzte Häufigkeitsverteilung der F2-Werte vor Normalisierung 
(durchgezogene Linie links und rechts: Mittelwerte des oberen und unteren Perzen- 
tilmittels; gestrichelte Linie: Mittelwert der Perzentilmitten nach Formel (25) von 
S.90, bezogen auf HG1). In Hellgrau gezeichnet sind zum Vergleich hochdeutsche 
Proben aus HG1 und HG2. 
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Kapitel 9 


Frankfurter Vokale im Wandel 


Zusammenfassung: In diesem Kapitel wird der VOKALJÄGER als phonetisch- 
phonologisches Werkzeug zur Untersuchung ausgewählter vokalischer Phäno- 
mene des Frankfurter Stadtdialekts verwendet. Der VOKALJÄGER ergänzt so- 
mit die Schriftbelege Oppels und Rauhs um algorithmisch gewonnene Daten 
aus jüngerer Zeit — mit dieser Kombination ist es möglich, den Sprachwandel 
des Frankfurterischen in Real-Time über zweihundert Jahre, von etwa 1800 
bis in die frühen 2000er, zu beschreiben. Die Abschnitte dieses Kapitels doku- 
mentieren jeweils den Vokalismus des Frankfurterischen und analysieren, ob 
sich ein in Real-Time beobachtbarer Lautwandel aus den Schriftbelegen oder 
der VOKALJÄGER-Untersuchung des Frankfurter Lautdenkmals von 1937 und 
der REDE-Aufnahmen aus den 2000ern ergibt. Untersucht werden unter an- 
derem das dunkle Frankfurter A im altlangen Ä (Abschnitt 9.4 ab S.306), 
das Dehnungs-A: (Abschnitt 9.5 ab S.319), das gekürzte A (Abschnitt 9.7 ab 
S.336) sowie das Monophthongierungs-A (Abschnitt 9.8 ab $S.351) und die 
Entrundung (Abschnitt 9.10 ab $.385). Eine Zusammenfassung findet sich 
in Abschnitt 9.11 ab S.398, welche mit einer vollumfänglichen Referenz aller 
Frankfurter Vokale in Abschnitt 9.12 ab S.409 abgerundet wird. 


Es zeigt sich insbesondere, dass das Frankfurterische sein markantes dun- 
kles A verlor. Das kurze dunkle A war schon zu Rauhs Zeiten im Verschwin- 
den begriffen und ist weder im Frankfurter Lautdenkmal noch in den jüngeren 
Aufnahmen zu finden. Das lange dunkle A hingegen existiert noch im Laut- 
denkmal, aber nicht mehr im REDE-Material. Dieser Merger mit dem neutra- 
len A ist Zeichen für den Untergang des Frankfurterischen nach dem Zweiten 
Weltkrieg. Die mit dem VOKALJÄGER gemessenen Phänomene sind in Ab- 
bildung 116 auf S.405 in einer Auswahl zusammengefasst. Die wichtigsten 
Lautwandelvorgänge des Frankfurter Stadtdialekts sind dann in Abbildung 
117 auf S.407 abschließend dokumentiert. Tabelle 58 auf S.412 ergänzt eine 
phonetisch-phonologische Gesamtübersicht über den Frankfurter Vokalismus. 
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9.1 Ziel, Auswahl und Vorgehen 


Das Frankfurterische zeichnet sich in seiner Vokalentwicklung durch ganz spezielle 
phonetisch-phonologische Muster aus. Zum einen definieren diese Muster den Un- 
terschied zum Hochdeutschen, wie etwa durch das Vorhandensein eines dunklen 
A, welches der Hochsprache fehlt. Zum anderen kontrastieren sie zu den Nach- 
bardialekten: während z.B. die Verdunklung des altlangen Ä im Frankfurterischen 
nur bis zum dunklen A ging, erreichte sie im Zentralhessischen geschlossenes O. 
Darüber hinaus sind die Muster über die Zeit veränderlich und ermöglichen das 
Dokumentieren eines Sprachwandels — abermals ist das dunkle A ein idealer Kan- 
didat: als kurzes dunkles A verschwand es Anfang des 20. Jahrhunderts, während 
es als langes dunkles A noch bestehen blieb. 

Die vorliegende Arbeit hat nicht den Anspruch, eine vollumfängliche Doku- 
mentation der Laute des Frankfurter Stadtdialekts zu sein - dazu sei nach wie vor 
auf die maßgebliche Arbeit von Rauh (1921a) verwiesen. Ebenso soll sie keine um- 
fassende Belegsammlung der bisher ungedruckten Belege Rauhs und Oppels sein; 
das mag einer Folgepublikation vorbehalten bleiben. 

Vielmehr führt sie mit dem VOKALJÄGER das Konzept der Klassifikations- 
phonetik in die historische Dialekt-Germanistik ein und zeigt, wie in Kombinati- 
on mit historischen phonetisch-phonologischen Schriftbelegen der Lautwandel des 
Frankfurterischen über zweihundert Jahre verfolgt und dokumentiert werden kann. 
Für das Frankfurterische ist es ein glücklicher und seltener Zustand, dass dieser 
Lautwandel in Real-Time sichtbar ist: Mit Oppel, Wülcker und Rauh haben wir 
zeitgenössische, phonetisch exakte Schriftbelege von Dialektforschern aus der Zeit- 
spanne vom ersten Oppel-Faszikel 1839 bis zu Rauhs Tod 1945. Rauh nahm den 
Stand der Frankfurter Mundart zweimal auf, einmal um 1920 für seine Dissertation, 
dann Ende der 1930er für den ersten Versuch zum Frankfurter Wörterbuch. Damit 
existieren vier Real- Time-Bestandsaufnahmen des Frankfurter Stadtdialekts, die in 
etwa mit den vier Hauptperioden 2 (1850-1875), 3 (1875-1900), 4 (1900-1925) und 
5 (1925-1945) korrespondieren (vgl. Abschnitt 7.3 ab S.259). Oppel und Rauh er- 
gänzten ihre etwa siebzig Jahre auseinander liegenden Ist-Beobachtungen durch 
Apparent- Time-Belege aus der ‚älteren‘ oder ‚jüngeren‘ Generation, was die Pha- 
sen miteinander verzahnt. Mit Oppels Belegen aus der alten Generation erschließt 
sich das zweite Viertel des 19. Jahrhunderts, die Hauptperiode 1 (1825-1850). Dar- 
über hinaus liefert die Mundartliteratur Schriftbelege, die in einzelnen und auch 
wichtigen Fällen durchaus belastbare Belege ab dem Ende des 18. Jahrhunderts 
liefert. Dies entspricht hier grob Hauptperiode 0 (1700-1825). Mit dem VOKALJÄ- 
GER kann abschließend der Lautstand des Frankfurterischen, wie er sich aus den 
Schriftquellen ergibt, empirisch und in Real-Time gegengetestet werden: Wie viele 
und vor allem welche Muster des Stadtdialekts des 19. und frühen 20. Jahrhunderts 
lassen sich in der Tonaufnahme des Frankfurter Lautdenkmals von 1937 und in den 
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REDE-Aufnahmen des 21. Jahrhundert noch nachweisen? Damit reicht das Beleg- 
material dieser Arbeit von etwa 1800 bis zum Jahr 2000. 

In den folgenden Abschnitten sind einige der wesentlichen phonetisch-kontras- 
tiven Muster des Frankfurterischen strukturiert dargestellt. Maßgeblich für die 
Auswahl war neben der phonologischen Relevanz der mess- und klassifikations- 
phonetische Zugang mit dem statistischen Instrumentarium des VOKALJÄGERS. 
Der Fokus liegt in dieser Arbeit vor allem auf den A-Lauten bzw. der Öffnungs- 
stufe der Hinterzungenvokale. Die A-Laute, insbesondere das dunkle A und das 
Monophthongierungs-A, sind herausragende Strukturmerkmale des Frankfurter 
Stadtdialekts, liegen in statistisch ausreichender Fülle sowohl in Schriftbelegen 
als auch Tondokumenten vor und sind mit dem VOKALJÄGER leicht phonetisch- 
kontrastiv vermessbar. Ergänzt wurde exemplarisch ein zweites wichtiges Muster 
des Frankfurter Stadtdialekts: die Entrundung bzw. die eingeschränkte Rundung 
der Vorderzungenvokale. Auch dies ist mit dem VOKALJÄGER sehr gut messbar. 
Zwangsläufig bleiben aber Muster unberücksichtigt. Um diese Lücke zu schließen, 
gibt der Ergänzungsabschnitt 9.12 ab S.409 einen vollständigen Überblick über 
alle vokalischen Muster des Frankfurterischen und erläutert sie kurz. 

Der Fokus der folgenden phonetisch-phonologischen Abhandlungen liegt auf ei- 
nem Lautwandel, der genau bestimmt werden kann: hinsichtlich der Schriftbelege 
ist das der von Oppel, Wülcker und Rauh beschriebene bzw. erschlossene Zeit- 
raum von etwa 1825 bis zu Rauhs Tod 1945 (vgl. Abschnitt 7.3, S. 259f.). Mit dem 
VOKALJÄGER analysierbare Tondokumente liegen erst ab dem 20. Jahrhundert 
vor. Lautmalerische Belege aus der Mundartdichtung reichen maximal bis Ende 
des 18. Jahrhunderts zurück und sind naturgemäß von fragwürdiger phonetischer 
Qualität. Das Erschließen noch älterer Lautstände für Frankfurt aus Urkunden ist 
zudem noch schwieriger: hier sei dazu auf Wülcker (1877) verwiesen. Auf eine Dis- 
kussion des Lautstands bzw. des Lautwandels in Frankfurt vor 1800 soll verzichtet 
werden. 

Die folgenden Abschnitte sind nicht klassisch-junggrammatisch angeordnet, wie 
etwa nach dem idealisierten Lautsystem des Westgermanischen. Vielmehr bauen sie 
Schritt für Schritt einen phonetischen Bezugsrahmen auf, in dem die wesentlichen 
Dialektmuster des Frankfurter Stadtdialekts mit dem VOKALJÄGER vermessen 
und dargestellt werden können. Die Abschnitte weisen pro Muster alle dieselbe 
Binnenstruktur von Unterabschnitten auf: In Klassisches Frankfurterisch ist ei- 
ne Beschreibung des Vokalstands vorangestellt, wie er sich aus den phonetischen 
Schriftbelegen Oppels, Wülckers und Rauhs ergibt!””. Ausgewählte Schriftbelege 
folgen im nächsten Unterabschnitt. Hier werden zum ersten Mal Rauhs, Wülckers 
und Oppels Belege in Auswahl kontrastiv gegenübergestellt und, was Oppel be- 
trifft, zum ersten Mal in originaler phonetischer Exaktheit veröffentlicht (vgl. Ab- 
schnitt 7.5.1 ab S. 264 zur Darstellung und Zitation). Aus dem großen Fundus an 


10”Da der Frankfurter Stadtdialekt untergegangen ist und hier im Wesentlichen eine Zeitperiode 
beschrieben wird, die hundert Jahre zurückliegt, ist als grammatikalische Zeit die Vergangenheits- 
form gewählt worden. Das historische Präsens wird nicht angewendet. 
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Schriftbelegen wurden vornehmlich solche ausgewählt, für die sowohl eine explizite 
Vokalnummer Oppels vorliegt als auch eine phonetische Transkription bei Rauh 
gefunden werden kann. Ergänzt sind weitere Belege Oppels und Rauhs, die für 
ein bestimmtes Dialektmuster besonders relevant sind. Hinzu kommen Informatio- 
nen etwa zu Oberrad aus Freiling (1925), zum Neu-Frankfurterischen aus Broxten 
(1985) und aus dem Frankfurter Wörterbuch — insgesamt werden über sechshun- 
dert Schriftbelege wiedergegeben (vgl. Abschnitt 7.5.1 ab $.264 zur Systematik 
und Notation der Belege). Daran schließen sich die Definitionen der phonetisch- 
phonologischen Wortgruppen an, auf denen der VOKALJÄGER seine Klassifika- 
tionsstatistik errechnet: die Kontrastgruppen. Der Unterabschnitt Klassifikations- 
phonetische Ergebnisse dokumentiert die zentrale Untersuchung des Frankfurter 
Lautdenkmals von 1937, des hochdeutschen Referenzmaterials aus dem Kiel-Kor- 
pus, ausgewählter Aufnahmen aus dem Projekt Regionalsprache.de (REDE) der 
2000er-Jahre und weiterer Proben (vgl. zu den Aufnahmen Kapitel 8, S.273f., 
und zur Methode des gleitenden Merkmals Abschnitt 5.1, S.170£.). Die Messer- 
gebnisse mit dem VOKALJÄGER werden ausführlich in tabellarischer und grafischer 
Form präsentiert — sie sind bewusst umfänglich gehalten, um völlige Transparenz 
zu liefern. Die Ergebnisse pro Dialektmuster werden im jeweiligen Unterabschnitt 
Diskussion besprochen. 

Eine abschließende Gesamtdarstellung des Vokalwandels und die Zusammen- 
fassung der Messdaten folgt zum Ende dieses Kapitels (vgl. Abschnitt 9.11 ab 
S.398). Ergänzt wird eine kurze Beschreibung des gesamten Frankfurter Vokalis- 
mus, die auch die nicht mit dem VOKALJÄGER untersuchten Laute dokumentiert 
(vgl. Abschnitt 9.12 ab S. 409). 
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9.2 Die O-Laute 


0 1 2 3 4 5) 
1700 1825 1850 1875 1900 1925 


mhd. Hauptperiode 1825 1850 1875 1900 1925 1945 HD 

o/o1/Ö Frankfurt o/o: o/or »/or »/o: 

wie hose, (Od mn, 

rot3, röt (Rauh) % 

-RT Frankfurt 5 2 3 z 

wie fort (Opel) ea ee 
(Rauh) & 2 

-RÜ Frankfurt 2/3: TE: 

wie sorgen (Ol) Ti 
(Rauh) 5/5 

-R Frankfurt 9: 2: 

wietor (opel A ne 
(Rauh) 6 


Übersicht: Die wichtigsten Lautentwicklungen für die O-Laute im Frankfur- 
terischen, wie sie sich aus den Schriftbelegen ergeben (obere Zeile: erschlossene 
IPA Lautwerte; untere Zeilen: originale Lautzeichen der Quellen; HD: Hoch- 
deutsch). Aufgeführt sind neben mhd. 0, O: und Ö auch die Konstellationen vor 
R sowie vor historisch auslautendem oder intervokalischem R. Die A-Lautung 
vor -RT betrifft nur Einzelfälle. 


9.2.1 Klassisches Frankfurterisch 


Die O-Laute sind ein wichtiger Bezugspunkt für die A-Laute des Frankfurterischen, 
spielen sich doch die wichtigsten Phänomene des Frankfurter A im Spannungsfeld 
zwischen den vokalischen Qualitäten von [a] und [5] sowie [o] ab. Entsprechend 
sollen die O-Laute mit diesem Abschnitt an den Anfang gestellt werden. 

Das Hochdeutsche kennt mit dem kurzen [5] und dem langen [o:] zwei qua- 
litativ unterschiedliche O-Laute, die insbesondere hinsichtlich des Öffnungsgrads, 
aber auch in der Lautdauer voneinander abweichen. Im Hochdeutschen ist Kürze 
an die vokalische Qualität des offenen [5] und Länge an die Qualität des geschlos- 
sen [o] gebunden, wenn man von Fremdwörtern einmal absieht. Für das klassische 
Frankfurterische war das nicht der Fall. Im Regelfall zeigte sich nur eine Quali- 
tät, geschlossenes [o], das aber sowohl lang als [o:] als auch kurz mit [o] vorkam. 
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So unterschieden sich etwa nhd. Hose, [ho:zo], kFra. [ho:s] und nhd. Rotz, [rsts], 
kFra. [rots], im Frankfurterischen nur in der Länge, nicht aber im Klang: Beide 
Male zeigt sich die geschlossene Qualität [o] als Grundvokal. Während die lan- 
gen O-Laute sowohl für das Hochdeutsche als auch für das Frankfurterische beide 
geschlossenes [o:] aufweisen, stimmen die Kürzen qualitativ nicht überein: Das 
Hochdeutsche hat kurzes offenes [>], das Frankfurterische hatte kurzes geschlosse- 
nes [o]. Andere, offenere O-Laute existierten im Frankfurterischen als Sonderfälle. 
Diese Varianten sind jedoch einzig Konstellationen vor altem -R vorbehalten. 

Rauh hörte um 1920 drei O-Qualitäten, die er als (o/>:), (0) und (0/ö) notierte 
und von denen die letzte die in Normalposition vorkommende übliche Qualität 
war (RAU:43). Rauhs (5/a:) erschienen nur vor historischem R und Konsonant, 
-RC, z.B. nhd. Dorf, mhd. dorf, kFra. [dsef]. Dieser O-Laut scheint dem offenen 
IPA-[>] gleichzugehen und soll auch so hier transkribiert werden. (>) ist Rauhs O- 
Laut mit dem größten Öffnungsgrad und, im Vergleich zu den A-Lauten, noch mit 
Rundung bzw. „gespannten Lippen“. Rauhs (5) bzw. [5] sehr ähnlich ist das dunkle 
A, was Rauh als (a) notiert (vgl. Abschnitt 9.4.1 ab S.306). Rauhs (9) hingegen 
ist ein „ein halboffener Laut zwischen (5) und (o)“, der aber einzig lang und nur in 
der Konstellation vor abschließendem oder vor intervokalischem R vorkam. Rauhs 
(0) soll hier als IPA-[o:], also gesenktem bzw. geöffnetem [o:], angesetzt werden. 
Rauhs (o) entspricht IPA-[o] und war der Regelfall des Frankfurterischen: „Die 
Lippen sind gerundet |...]. (0) klingt geschlossen wie (6)“. 

Auch Oppel unterschied für das O in Normalposition keine Qualität, wohl aber 
Quantität. Er verzeichnete kurzes (o) und langes (ö), also beide mit derselben 
Vokalnummer 12: „rein und tief (dunkel)“ (OPF: 1.1.1). So sei hier angenommen, 
dass Oppels (o), also das O in Hauptperiode 2, qualitativ mit IPA-[o] überein- 
stimmt. Der qualitative Zusammenfall der O-Laute in geschlossenem [o] bzw. [o:] 
als Regelfall scheint über den ganzen Zeitraum der klassischen Hauptperioden 1 
bis 4 unverändert vorgeherrscht zu haben -— weder Oppel noch Rauh vermerken 
diesbezüglich etwas Abweichendes. Nur einen O-Laut, und zwar geschlossenes [o], 
haben auch das Oberdeutsche und das südliche Mitteldeutschland, insbesondere 
Südhessen, so auch Klein-Gerau (Schirmunski [1962, 245] und Born [1938, 16 und 
75£.]). Das Zentralhessische hingegen kennt neben geschlossenem [o] auch offenes 
[>] (Wiesinger 1980, 79). 

Durch R geöffnete kurze OÖ erhielten von Oppel die Vokalnummer 11, (ö), z.B. 
(mörjens) aus morgen, [maejo] (Die Markierungen für O vor R sind allerdings 
überaus selten. Langes O vor R, wenn markiert, erscheint abweichend als (ö)). Die 
Vokalnummer 11 steht aber normalerweise für das dunkle A, dann aber mit einem 
A-Graphem, also (a). Das legt den Schluss nahe, dass offenes O und dunkles A 
in etwa denselben Lautwert [5] hatten, was dann in Abschnitt 9.4.1 ab S. 306 im 
Detail erläutert wird. Für diesen Abschnitt zum O genügt es festzustellen, dass die 
von Rauh beschriebene O-Öffnung vor R von Oppel tendenziell bestätigt wird. 

In der Konstellation vor -RT schienen [5] und [e] in einzelnen Wörtern eine 
Tendenz zur Verschmelzung zu einem hellen palatisierten A, [a], gehabt zu haben. 
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Jedenfalls hörte Rauh 1920 etwa |fset]* — [fat]? für fort bei Schulkindern!0® 

Die wesentlichen O-Laute des Frankfurterischen gehen auf altkurzes O bzw. 
in der Dehnung O: und altlanges Ö zurück. Für die Altlaute hatte das Frank- 
furterische [o] im Fall bewahrter Kürze und [o:] im Fall der Länge, also gleiche 
Qualität, aber unterschiedliche Quantitäten (vgl. Schriftbelege, Punkt 1, S.289). 
Unabhängig vom zugrundeliegenden Laut und Quantität erschien bis Hauptperi- 
ode 4 vor intervokalischem oder abschließendem R [o:] sowie vor R und Konsonant 
[5/>:]. Somit ist konsonantische Rahmung für die Qualität des O in der Frankfurter 
Mundart verantwortlich. 


9.2.2 Ausgewählte Schriftbelege 


1. O in Normalposition: 


()o > [ol > ha.)] 

» Holz. (holz). > [holds]: OPF?, II.84: Waljerholz (Nudelholz). Rau“, 
209: holds. & Umlaut: Hölzchen, Dim.: » [helzir]: RAu25%, 72: helst. — 
» klopfen. (klopfen). > [kloba]: Rau“, 103.1: klobo. — » Kopf. (kopf). 
> [k"op/kop®]: OPF?, 11.88: Köpp. Raunf, 67: khop. RAUH*, 67: koph, 
„auch “. & Umlaut: Köpfe:  [k"ep]: OPZ?, 1.175: Köpp. — » Loch. (loch). 
> [lox]: Rau?, 103.1: lox. RAau*, 70: knoplox (Knopfloch). — » noch. 
(noch). > [nox]: OPF’®, 1.5.70: nöch. — » Rotz. (rotz). > [rots]: Rau“, 
103.1: RotS. — » tropfen. (tropfen). > [trobo]: Rau*, 103.1: trobe. 
®& Umlaut: Tröpfchen (Dim. Pl): © [e]: OPZ?, 11.15.4: Tröppercher. — 
» wollen. (wollen). md. > [volo]: OPF?, 1.5.70: wölt. 


(b)or > [or] > hd.f[or] 

» Bogen. (bogen). > [borya]: OPF?, 515: Rächebooche (Regenbogen). 
Rau“, 103.1: böxo. — » hohl. (hol). > [ho: 1]: Rau‘, 103.1: höl. — 
> holen. (hole). > [ho:o]: Rau*, 103.1: hölo. — » Hose. (hose). > 
[ho:s]: RaAu?, 103.1: hös. — > Ofen. (oven). & [o:vo]: Rau“, 103.1: 
öwo. — » Vogel. (vogel). > [foryl]: OPF?, 1.230: Vogelschei oselschei, 
che). Rau“, 66: föxl. © Umlaut: Vögel: » fe: 31]: Te?: Vegel. Op2, 1.16.12: 
Veechelcher. RAu?, 216.11: fe3l. 


()ö > [oJ > ha.lor] 
» Brot. (bröt). > [proit]: OPF?, 1.140: Brod. Rau, 129: pröt. — » groß. 
(gröz). > [kro:s]: OPF?, 1.300: kröß. Rau“, 129: krös. & Umlaut: größer: 
n [kre:z&]: OP?, 1.14.4: greeßer. Rau*, 130.1: krösä. — » Floh. (vlöch). 


1087um Lautwert von [a] vgl. Abschnitt 9.8.1.3 ab $.356. Eine völlig identische Öffnung vor 
historischem -R oder -RC hin zu [»/5:] bzw. [o:] fand auch für U statt, z.B. [voeft]* für Wurst 
(vgl. Punkte 8b auf S.420 und 8d auf S.420) - diese lautlich Sunivaleiten Markierungen von U 
vor R mit (o) sind bei Oppel ungleich häufiger, z.B. (Worscht), da deutlich von der Hochsprache 
abweichend und bestätigen (6) als [5]. Auch hier fand sich vor -RT als auch -RST in Einzelwörtern 
eine Tendenz zu palatisiertem [a] in späterer Zeit, so z.B. eben [vaft]? für Wurst. 
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> [flor]: Rau, 129: flö. — » hoch. (höch). > [ho:x]: Rau*, 129: höx. — 
» Not. (nöt). > [no:t]: OPF?, 1.195: Nötlieh (Notlüge). RAU?, 129: nöt. 
— »rot. (röt). > [ro:t]: OPZ?, 11.19.9: röht. Rau?, 129: röt. — » tot. 
(töt). > [do:t]: OPF?, 11.55: Dödeh&mbdch& (Totenhemd, Dim.). RAU“, 
129: döt. 


2. O vor historisch intervokalischem oder auslautendem R: 


(a)o:-R > [oil > ha.[or] 
» bohren. (boren). > [boren]: Rau?, 103.3: bo*n. — » geboren. (ge- 
boren). > [Qeboren]: OPF°, 1.5.70: higeböre. Rau‘, 103.3: gebö*n. — 
» Tor. (tor). & [dore]: RAu?, 103.3: dö*. & Umlaut: Törchen: > [daere39]: 
Rau“, 105.2: da'®30. — » verloren. (verloren). > [f&loren]: Rau“, 
103.3: fälo"n. — » vor. (vor). D [fore]: OPF?, 1.230: Vörredd& (Vorre- 
de). RAu?, 103.3: for. 

(b)ö-R > [oe] > hd.[or] 
» Ohr. (öre). > [pre]: OPF?, 1.197: Orfei (Ohrfeige). Rau?, 129.2: 9°. — 
» Rohr. (rör). > [rore]: OPZ?, 1.45.1: Rohrspätz. RAu*, 129.2: ro. 


3. O vor historischem R und einem weiteren Konsonanten: 


(a)o-rRrT > [3° [a > ha.f>] 
>» fort. (vort). > [foet]*: Rau, 103.4: fort. > [fat]: Rau, 103.4 Anm. 4: 
fat. — » Wort. (wort). > [voet]: RAu?, 103.4: wo*t. & Umlaut: Wörter: 
n [vaered&]: Rauf, 211.2.a: waltdaä. 

(b)o-RC > [Pb] > ha.b] 
» Dorf. (dorf). > [def]: RAu*, 103.4: do*f. @ Umlaut: Dörfer: » [dev]: 
OPZ?, 1.15.16: Dörfer. RAu?, 105.2: dee*vä. — » geworfen. (geworfen). D 
[gov»evo]: Rau“, 103.4: gowo*vo. — » Korn. (korn). > [k"sen]: OPF?, 
1.5.70: p6fferkörn (Pfefferkorn). RAU‘, 103.4: kho*n. 

()ö-RC > [P] > hab] 
» horchen. (hörchen). > [hae3o0]: Rau“, 129.3: ho*so. 

(d)o-rC > [3] > hd.[or] 
» gestorben. > [kfdorevo]: Rau*, 103.4: kSda() wo. — » morgen. (mor- 
gen). > [maxejo/mazint]: OPF?, 11.45: heut Morjend. OPZ?: mörjens. 
Rau‘, 103.4: m5'%)jo, möint. — » worden. (worden). > [voren]: Rau, 
103.4: wö"n. — » sorgen. (sorgen). > [sorejo]: Rau, 103.4: söYjo. & 
Ableitung: Sorge: D [ssef]: 211.B: so*S. 
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9.2.3 Die Kontrastgruppe DO im VokalJäger 


Die O-Realisierungen der Sprachproben wurden in folgende vier Kontrastgruppen 
eingeteilt, die durch die phonetisch-phonologischen Muster der O-Laute motiviert 


sind: 
6) Wörter mit kurzem O: Das klassische Frankfurterische hatte hier ge- 
schlossenes [o], das Hochdeutsche hat offenes [3]. 
0: Wörter mit langem O: Das klassische Frankfurterische hatte hier ge- 


schlossenes [or], ebenso das Hochdeutsche. 


0-rC Wörter mit langem oder kurzem OÖ vor R und einem weiteren Konso- 
nanten: Das klassische Frankfurterische hatte hier geöffnetes [5] und 
[>], das Hochdeutsche hat [o:] bzw. [>]. 


O:-r Wörter mit langem O vor abschließendem oder intervokalischem R: 
Das klassische Frankfurterische hatte hier offeneres [o:], das Hochdeut- 
sche hat geschlossenes [o2]. 


Im Frankfurterischen ist der zugrundeliegende O-Altlaut, also mhd. 0, O: oder 6, 
irrelevant: die zu erwartende Klangfarbe hängt einzig von den Folgekonsonanten 
ab. Somit sollte im Frankfurterischen ein geringerer qualitativer Unterschied von 
kurzem O und langem O zu messen sein. Technisch muss daher das Kontrast- 
paar [0x 0] untersucht werden: Für ein ideelles Frankfurterisch wird ein AC =0 
erwartet. Diese Konstellation des reinen Quantitätsunterschieds [o] und [o:] im 
Frankfurterischen ist in Diskrepanz zum Hochdeutschen, wo die Kürze [5] auch 
qualitativ von der Länge [o:] abweicht. Im Hochdeutschen sollte im Kontrastpaar 
[0: O0] ein Ad =1 zu finden sein. Folglich müsste in Sprachproben mit geringe- 
rer oder geschwundener Frankfurter Dialektalität und insbesondere für Sprecher 
des Hochdeutschen sehr wohl ein qualitativer Unterschied messbar sein. Angesetzt 
wird das Merkmal der Öffnungsstufe der Hinterzungenvokale. Für ein offenes [»] 
ist ein GC = 3 und für ein geschlossenes [o] ein d = 2 erwartet: Die statistische 
Merkmalsdifferenz zwischen reinem [5] und [o:] sollte AC = 1 sein. Ist die gemes- 
sene Merkmalsdifferenz im Kontrastpaar [0 0: | nicht signifikant bzw. zu gering, 
muss man davon ausgehen, dass kein qualitativer Unterschied vorliegt. Das ist 
wichtig, denn die Nicht-Signifikanz des qualitativen Unterschieds zwischen langem 
und kurzem O ist ein Dialektalitätsmerkmal des Frankfurterischen. Für die eher 
sekundären Kontrastgruppen 0-rC wird C = 3 bzw. [5] und für Ox-r ( = 2,5 bzw. 
[o:] angesetzt!®. 

Ein Sprecher bzw. eine Sprachprobe wird als Frankfurterisch markiert, wenn 
vor allem im Kontrastpaar |0r 0] kein signifikanter Abstand gemessen wird. Für 
die Berechnung der numerischen Dialektalität d wird ein Al = 0 erwartet und 


10° Unter der Annahme, dass vor -RT noch [>e]* und noch nicht [a]? steht — diese Konstellation 
kommt aber im Frankfurter Lautdenkmal nicht vor. 
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(* = 3 gesetzt. Als hinreichende Nebenbedingung soll für die Kontrastgruppe O 
ein C < 2,5 gelten, also eine tendenzielle Annäherung an die Gruppe Oz, für die 
ein ( = 2,0 erwartet wird. 

Exemplarische Messwerte des VOKALJÄGERS für die Merkmalswerte ( und die 
Merkmalsdifferenzen AG sind in Tabelle 36 auf S. 293 wiedergegeben. Die vollstän- 
digen Ergebnisse zu ( werden in Abbildung 94 auf S. 295 dokumentiert, wo auch 
die Schwankungsbreiten abgelesen werden können. Die Messungen zu AC finden 
sich in Abbildung 95 auf S. 296. Weitere Zahlenwerte und ein Test auf frankfurte- 
rische Dialektalität hinsichtlich des Kontrastpaars [0x »O]| sind in Tabelle 37 auf 
5.294 gedruckt. Ergänzende Daten zu AC"P liefert Abbildung 143 auf 8.479 im 
Anhang. Einzelheiten zum Aufbau der Kontrastgruppen und den C® und (! sind 
ebenso im Anhang ab Abbildung 123, S. 459£., beigelegt. 


9.2.4 Diskussion 


Die höchsten Probendichten liegen in den Kontrastgruppen Or und O vor und so soll 
für die Dialektalitätsbeurteilung der O-Laute der Schwerpunkt auf das Kontrast- 
paar |0: 0] gelegt werden. Die für das Hochdeutsche erwartete Distanz Ad =1 
zwischen Oz und 0D findet sich im Wesentlichen genauso für die hochdeutschen Spre- 
cher; auch ist diese Differenz, wie vermutet, signifikant. Man findet z.B. für den 
hochdeutschen Sprecher K10MR in der Kontrastgruppe 0 ein ( = 3,0 [3,0-3,3] und 
in der Gruppe Oz ein (C = 2,0 [1,8-2,0]. Im Kontrastpaar [0x 0] bestimmt man 
ein hochsignifikantes AG = 1,0** [1,0-1,0]. 

Für das Frankfurter Lautdenkmal (FraLD) misst man hingegen für die kurzen 
O-Laute ein C = 2,5 [2,0-2,7] und für die langen ein ( = 2,0 [2,0-2,5]. Die originäre 
Merkmalsdifferenz ergibt sich zwar mit Al’ = 0,5"* [0,0-0,5] nicht zu Null, aber der 
Messwert ist nicht signifikant von Null verschieden: die Verteilungen der Gruppen 
Or und O überlappen zu stark, was sich auch in einem tendenziell niedrigen COS 
von 0,3 ausdrückt. Aus der Nichtsignifikanz ergibt sich letztlich für das Frankfurter 
Lautdenkmal ein Al = 0. So kann man davon ausgehen, dass sich im Frankfurter 
Lautdenkmal der alte frankfurterische Lautstand bewahrt hat, in dem langes und 
kurzes O in einem Laut [o] qualitativ zusammenfielen. Ähnlich und auch erwartet 
ist der Befund für den Klein-Gerauer Lautdenkmal-Sprecher KG1. Er wiederholt 
sich nicht für KG2, allerdings ist hier die Probendichte recht niedrig. 

Interessant ist zu vermerken, dass die meisten Sprecher des Neu-Frankfurte- 
rischen ebenfalls signifikant von Null abweichende Merkmalsdifferenzen aufweisen, 
genauso wie das Hochdeutsche. Selbst für einen Sprecher wie FraF2L mit einem 
nominal geringen AC = 0,40* [0,23-0,40] bleiben die Gruppen Or und 0 signifi- 
kant getrennt — auch ist hier die Trennung der Verteilungen mit einem COS = 0,7 
immer noch deutlich. Die Neu-Frankfurter sprechen also O-Laute, die eher dem 
Hochdeutschen als dem Frankfurterischen ähneln: langes O und kurzes O sind 
qualitativ getrennt. Eine Ausnahme ist der ältere Sprecher FraFAlL, bei dem die 
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Al AG 
0 0O-rC 0:-r 0 0O-rC 0:-r 
kFra C 20 30 25 FraLD C 2,5 35 22 
0 o 2,0 0 
0-rC h) 3,0 1,0 0-r 35  (1,0)® 
O:-r 0 25 05.085 Ds, 228. 0a)" 
0: o 2,0 _ 10 05 0: 2,0 (0,5)"° (1,5)5 (0,2)"° 
AC MC 
0 0-rC 0O:-r 0 0-rC 0O:-r 
HD £ 30 30 20 FraLC 29 34 20 
0 M) 3,0 0 2,9 
0-rC 6) 3,0 — 0-rC 3,4 0,5* 
0:-r 0! 2,0 1,0 1,0 0:-r 2,0 0,9°*  1,4°* 
0: o 20 10 190 - 0: 2:0: .0;9°* -1,4= (je 


Tabelle 36: Exemplarische Merkmalswerte C und Merkmalsdifferenzen AC für die O- 
Laute (Gruppen 0, Oz, O-rC, O:-r) im Kontrast. —kFra: ideelle Referenzwerte eines 
Sprechers des klassischen Frankfurterischen aus Hauptperiode 4 (1900-1925); HD: 
entsprechende Aussprache im Hochdeutschen. —Messungen mit dem VOKALJÄGER: 
FraLD: Das Frankfurter Lautdenkmal von 1937; FraLC: Sprecherin des Neu-Frank- 
furterischen, hier mit nahezu hochdeutschem Lautmuster. Angesetzt wurde das glei- 
tende Merkmal der Öffnungsstufe der Hinterzungenvokale. Man beachte insbesondere 
das Kontrastpaar [0 0: ]: Für FraLD misst man hier ein AC = 0 aus AC® = (0,5)"$ 
[0,0-0,5], also eine nicht-signifikante Differenz, während sich bei FraLC ein signifikan- 
ter Unterschied von AC = 0,9** [0,3-0,9] ergibt (alle Werte in den Tabellen sind mit 
einer Stelle Genauigkeit wiedergegeben; nicht-signifikante originäre AC® sind jeweils 
in Klammern gesetzt und stehen für ein endgültiges AC = 0; das Signifikanzniveau 
ist hochgestellt; Werte mit AC® < 0,05 sind als ‚— gedruckt). 
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0: 0 
Sprecher COS nı wm Gh m wm & AV a A 9% 
FraLD 03 179 20535 1 25 05 ms - 08 x 
KG1 076 6 20 18 8 22 02 th - 09 x 
KG2 09 3 318 9 5 2709 *09 - 


kraköt. 07 29,18 18 28 1922 0a. * 0a = 
FafL 06 21 2 20 4 16 30 10 * 10 - 
FaFflL 06 9 1 20 20 2 29 09 * 09 - 
FraFAlL 08 7 2 2:5 5 20 ee - To“ 
FraFA2L 04 16 3 20 8 17 24 04 * 04 - 
Barll, 07 18 22: 2,5 37. 21.30.10 10. & 


Tabelle 37: Beurteilung der Dialektalität der O-Laute anhand der Merkmalsdi- 
stanz AC® des langen O-Lauts (0:) und des kurzen O-Lauts (0). Ein für die Frank- 
furter Stadtmundart typisches, signifikantes und dialektales Muster bzw. eine bi- 
näre Dialektalität wird mit x markiert (Hauptbedingung Ad = 0; Nebenbedingung 
(a < 2,5). V misst hier den Merkmalsunterschied zwischen dem ( der Gruppe O und 
dem hypothetischen (* = 3 des Hochdeutschen. Signifikanzen a: xx: hoch signifi- 
kant; x: signifikant; ‚ls‘: zu geringe Probenzahl; ‚th‘: Minimaldistanz nicht erreicht: 
‚ns‘: nicht signifikant. COS: Bhattacharyya-Distanz als Maß für die Trennung der 
Verteilungen, — 1: getrennt; n: Probenzahl; w: Zahl der Stämme. Für Werte < 0,05 
steht ‚—‘. Der Unterschied zwischen langem und kurzem OÖ ist bei den Dialektspre- 
chern FraLD, KG1 und FraFAIL nicht signifikant, was dem Muster der Mundart 
entspricht — wohl aber bei allen Sprechern des Hochdeutschen. 


Gruppen zusammenfallen, genauso wie im Frankfurter Lautdenkmal. 
Auch Rauh beobachtete schon um 1920 eine Bewegung vom dialektalen kurzen 
geschlossenen [o]* hin zu einem hochdeutschen [>]?: 


„Die Halbmundart spricht für (o) einen Laut, der mit geringerer Hebung der Zunge gespro- 
chen wird und einen etwas offeneren Klang hat, doch dem des (o) nicht gleich ist, sondern 
schriftsprachlichem kurzem (o) entspricht“ (Rauh 1921a, 60). 


Der Zusammenfall der O-Laute ist ein eher verstecktes Muster, das nicht jedem 
Sprecher bewusst sein mag. Es steht im Kontrast zum Hochdeutschen und lässt 
sich vermutlich auch nicht einfach imitieren. Bezeichnenderweise fehlt es bei den 
Neu-Frankfurter Sprechern weitgehend - selbst in der Probe, die möglicherweise 
von der Volksschauspielerin Liesel Christ stammt (FraLC). 
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Öffnungsstufe O-Laute 
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Abbildung 94: Die O-Laute (insbesondere kurz: O und lang: Or) im VOKALJÄ- 
GER. Verteilung des gleitenden Merkmals der Öffnungsstufe der Hinterzungenvoka- 
le C für verschiedene Sprecher. Anordnung in Gruppen von links nach rechts: LD: 
Lautdenkmal; HD: Hochdeutsch in Auswahl und Mittel; NF: Neu-Frankfurterisch, 
insbesondere REDE. Das Symbol und der unten gedruckte Wert zeigen den Medi- 
an an, also C; der vertikale Strich den C-Interquartilbereich zwischen dem 25%- und 
75%-Perzentil. Das obere Zahlenpaar protokolliert die Probenzahl n und Zahl der 
Stämme w, getrennt mit ‚/‘. Während der Merkmalswert des langen O, Gruppe 
Or, dem Hochdeutschen mit ( = 2 im Wesentlichen entspricht, ist bei vereinzelten 
Dialektsprechern mit C > 3 für 0 ein Überschreiten des hochdeutsch zu erwarten- 
den Werts zu vermerken. Das Frankfurter Lautdenkmal (FraLD) zeigt mit ( = 2,5 
[2,0-2,7] für die Gruppe O der kurzen O-Laute eine deutliche Bewegung hin zu den 
geschlossenen O-Lauten. 
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Intra-Sprecher-Distanzen: Öffnungsstufe O-Laute 
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Abbildung 95: Merkmalsdistanz Al zwischen dem langen und dem kurzen O- 
Laut (Oz, DO) als Referenz und den anderen O-Lauten (0, O:-r und O-rC) desselben 
Sprechers als Vergleich (Symbol: Merkmalswert ( der Referenz; vertikaler Strich und 
Zahl: originäre Differenz AC® bezüglich des gleitenden Merkmals der Öffnungsstu- 
fe der Hinterzungenvokale; das andere Ende des Strichs zeigt mit dem Symbol ‚— 
das ( des Vergleichslauts an). Referenz- und Vergleichslaut gelten als unterschied- 
lich, falls die Distanz AC® signifikant ist (**: hoch signifikant; x: signifikant; ‚Is: zu 
geringe Probenzahl; ‚th‘: Minimaldistanz nicht erreicht: ‚ns‘: nicht signifikant). Der 
COS Parameter misst das Nicht-Überlappen der Verteilungen (hier: 1, stark überlap- 
pend, bis 4, weitgehend getrennt). Bei vereinzelten Dialektsprechern sind langes und 
kurzes O nicht signifikant zu unterscheiden, wohl aber deutlich im Hochdeutschen. 
Insbesondere im Frankfurter Lautdenkmal (FraLD) liegt im Kontrastpaar [0:0] 
mit AG = (0,5)"? = 0 [0,0-0,5] keine signifikante Differenz vor, obwohl die originäre 
Differenz nominal groß erscheint: beide Laute fallen qualitativ zusammen. 
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Übersicht: Die wichtigsten Lautentwicklungen für das altkurze und kurzgeblie- 
bene A im Frankfurterischen, wie sie sich aus den Schriftbelegen ergeben (obere 
Zeile: erschlossene IPA Lautwerte; untere Zeilen: originale Lautzeichen der Quel- 
len; HD: Hochdeutsch). Der Lautwert bleibt über alle Perioden unverändert. 


9.3.1 Klassisches Frankfurterisch 


„Mhd. a wird im Rheinfränkischen und Zentralhessischen durch neutrales bis helles 
a vertreten“ (Wiesinger 1980, 85). Dies gilt ebenso für die meisten kurzen A-Laute 
des Frankfurterischen. Zugrunde liegt hier altkurzes A, welches vor allem in ge- 
schlossener Tonsilbe kurz geblieben ist, z.B. nhd. Affe, mhd. affe, [af] (Paul 2007, 
87). Lange A-Laute im Frankfurterischen sind hingegen meist dem [5] genähert 
bzw. velar oder ‚verdunkelt‘ (vgl. Abschnitte 9.4.1 und 9.4.1.1 ab S. 307). Aller- 
dings gibt es durchaus auch kurze dunkle A-Laute im Frankfurterischen: diese 
gehen aber in der Regel auf ehemalig langes und damit dunkles A zurück, welches 
verkürzt wurde (vgl. Abschnitt 9.7 ab S.336). Ebenfalls ein A hatte der Frankfur- 
ter Stadtdialekt an Stellen, in denen das Hochdeutsche die Diphthonge EI und AU 
aufweist — hier handelt es sich um das sogenannte Monophthongierungs-A, was in 
Abschnitt 9.8 ab S.351 detailliert besprochen wird. In diesem Abschnitt soll der 
Fokus auf dem normalen, kurzen neutralen A-Laut des Frankfurterischen sein. 


„Die Klangfarbe des (a) unterscheidet sich nicht von dem des schriftdeutschen Lauts [...] Die 
Lippen bilden bei loser Mundwinkelstellung eine weite Öffnung, die größte bei der Bildung 
der Vokale überhaupt“ (RAU: 42.2). 


Entsprechend soll für das kurze neutrale Frankfurter A das Standard-IPA-Zeichen 
für das hochdeutsche A verwendet werden, also [a]. Rauh nutzte hingegen das 
Schriftzeichen (a) für diesen neutralen A-Laut und das Zeichen (a) für das dunkle 
A (vgl. Abschnitt 9.4.1 ab S. 306)!'°. Oppel bezeichnete das neutrale Frankfurter A 


1101n dieser Arbeit wird das IPA-Zeichen [a] für das dunkle A genutzt und das IPA-Zeichen [a] 
für den neutralen A-Laut — womit die IPA-Zeichen gegenüber Rauhs Teuthonista-Zeichen von 
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als „rein“ (OPF: 1.1)!"!. Er gab dem neutralen A die Vokalnummer 1 und schrieb es 
als (a). Das dunkle kurze A hingegen bekam die Vokalnummer 11 (vgl. Abschnitt 
9.4.1 ab S. 306). 

Wülcker (1877, 18) machte die Aussage „Unser stadtdialect zeigt in vielen 
schichten der bevölkerung das kurze a zu einem mittellaute zwischen a und o 
verschoben [...], “ was in den Folgejahren zu etwas Verwirrung führte!!?. Als Rauh 
diese Stelle in seiner Dissertation 1921 diskutierte, folgerte er daraus, dass es wohl 
1877 keine Trennung zwischen kurzem neutralen A und kurzem dunklen A ge- 
geben habe, obwohl sich das so gar nicht mit seinen Beobachtungen deckte. So 
nahm er an, dass beide A vor seiner Zeit einheitlich und eher dunkel gesprochen 
worden seien: „Hiernach müßten wir schließen, daß ohne Ausnahme in der Kürze 
mhd. a überall gleich ausgesprochen wurde“ (RAu: 95). Dem schloss sich Frei- 
ling (1924, 192) an: „Das läßt den Schluß zu, daß die frühere Mundart allgemein 
den verdunkelten Laut hatte“. Den offensichtlichen Widerspruch zur Situation um 
1920 konnte Rauh seinerzeit noch nicht auflösen und vermutete eine von Wülcker 
nicht genau markierte, aber dennoch vorliegende, schwache Trennung der Laute 
und einen diese Trennung herausarbeitenden Lautwandel in den folgenden vierzig 
Jahren. Rauh kannte zwar Wülcker, aber zu dieser Zeit noch nicht Oppel - und 
dort hätte er Bestätigung für seine gesonderte Beschreibung der Laute gefunden: 
Oppel verzeichnet für um 1850 im Wesentlichen dieselbe Trennung zwischen kur- 
zem neutralen A und kurzem dunklen A wie Rauh um 1920. Das spricht gegen 
eine andere Situation 1877 und macht die Annahme eines Lautwandels unnötig. 
Auch bezeichnet Wülcker etwas später in dem Artikel eindeutig das kurze neu- 
trale A mit einem anderen Schriftzeichen als das dunkle kurze A, wenn er z.B. 
(fass), Fass, zu (schnäwel), Schnabel, kontrastiert. Damit scheint die von Rauh 
zitierte Wülcker-Textstelle eher eine missverständliche Formulierung zu sein und 
zu falschen Schlüssen geführt zu haben. 

Ebenso missverständlich ist die vermeintlich allgemeingültige Aussage des Frank- 
furter Mundartdichters Carl Malß (1792 — 1848) in seinem Wörterbuch des Bürger- 
Capitains von 1821: „Das A wird größtenteils wie ein Mittellaut zwischen a und o 
ausgesprochen, wie z.B. in: ich war: ich wärn; die Waare: die Währ‘ (MAB: 113) 
Doch aus den von Malß angeführten Belegen erschließt sich eindeutig, dass seine 
Zeile das dunkle Dehnungs-A beschreibt (vgl. Abschnitt 9.4.1 ab S.306) und eben 


(a) für das neutrale A und (a) für das dunkle A gerade vertauscht sind, was bei der Lektüre 
der Originalbelege zu beachten ist. Rauhs Teuthonista-Zeichen werden immer identisch zum 
Original geschrieben und sind, um Verwechslungen vorzubeugen, in Volltextzitaten in Graphem- 
Klammern (.) gesetzt. In den Belegen sind sie ohne Klammern gezeigt. 

!11n Oppels Schreibschrift erscheint durchweg das übliche Kurrent-A der Zeit. Somit nutzte er 
das seinerzeit übliche Schrift-A und zeigte nicht etwa mit verschiedenen A-Schreibungen Lautun- 
terschiede an, wie es etwa Rauh tat. Somit soll hier Oppels A indifferent immer mit dem Zeichen 
(a) gesetzt, werden, was dem üblichen A-Satz des Fließtexts in dieser Arbeit entspricht. 

112 Wülcker setzt (ä) für das kurze dunkle A und (ao) für das lange dunkle A. Darüber hin- 
aus verwendet er keine besondere Lautschrift: Das Schriftzeichen (a) für A ist nur Folge des 
Drucksatzes: (a) erscheint in den kursiv gesetzten Belegen, sonst (a). 
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nicht das kurze neutrale At". 

Festzuhalten bleibt: Das frankfurterische kurze A war im Regelfall neutral und 
über alle Hauptperioden hinweg deutlich von dem dunkleren A, das sowohl in 
Kürze als auch Länge auftreten konnte, unterschieden. Es ist dem hochdeutschen 
A im Lautwert [a] identisch. 


9.3.2 Ausgewählte Schriftbelege 


1. Kurzes A vor historisch einfachem Konsonanten: 


A > [al > hd.[al 

» Fass. (va3). > [fas]: OPF?, 1.19.10: Faß: &. OPZ?, 1.36.4: Faß. WÜF®, 29: 
fass. RAU?, 90.1: fas. BRO’, SpB, 25: fas. & Umlaut: Fässi, Dim.: » ll: OPZ2, 
1.472: Fässi. — » Hass. [haz). > [has]: OPF?, 1.19.10: Haß: ä& — » nass. 
(naz). > [nas]: OPF?, 1.19.10: naß: ä. RAU“, 90.1: nas. Rau’, 192: „hell“, 
„Schuljugend“. & Urnlauk Nässe: » ne: OPZ2, 1.22.15: Ness. — » Sack. 
(sac). > [sak]: OPF?, 1.19.4: Sack: ä&. RAU“, 90.1: 2uk. RauZ>, MW: dr&ksäk. 
® Umlaut: Säckel: — [segl]: RAu?, 165.1: ses, 


2. Kurzes A vor historischem -CH: 


A-ch > [a] > hd.[a] 

» Bach. > [bax]: OPF?, 1.19.7: Bach: &. OPZ?, 1.23.5: Bachelche mache, „der 
Dim. v. Bach in dieser Phrase ohne Umlaut, sonst meist allgemein Bächelche “ 
(urinieren). RAU?, 90.1: bax. — » lachen. (lachen). > Havel: OPF?, 1.5.7: 
gelacht. OPF?, 1.19.7: lache: ä. OPF?, 11.107: ich lach. RAau!, 90.1: le — 
» machen. (machen). > dal OPF?, 1.300: mäch£. Rau* 90.1: maxoa. © 
Umlaut: » [e]?: OPZ?, 1.12.8: dek möcht. 


3. Kurzes A vor historischer Mehrfachkonsonanz: 


A > [al > hd.[a] 

> Acker. (acker). > [28]: OPF?, 1.19.4: Acker: ä. © Umlaut: Äcker: » [ed]: 
OPZ?, 1.45.8: ägger. RAU?, 98.1: egä. — » Affe. (affe). D [af]: OPF?, 1.19.5: 
Af: &. Rau‘, 90.1: af. — > Apfel, (apfel). > [abl]: OPF?, 1.19.3: Abbel: a 
OPF?, 1.134: Anehäppei (Augapfel). RauK%, 50: abl. & Umlaut: Äpfel:  [ebl]: 
OPF?, 1.315: ebelwai Be RAU, 98.1: ebl. — » backen. (backen). > 
[baga]; OPF2, 1.19.4: backen: &. Raut, 90.1: bago. & Umlaut: Bäcker: » 
[beg&]: OPZ?, 11.272: Bäcker. elle (vallen). > [falo]: OPF?, II.107: 
falle, ihr fallt, gefalle Rau, 90.1: falo. © Umlaut: er fällt: » [fell]: OPF?, 
1.370: fällt. — » Flasche. (ulasche); > [flaf]: OPF?, 1.19.10: Flasch: ä. RAU‘, 
90.1: flaS. © Umlaut: Flaschen: » [fe]: WüM!, 17 (1405, 1442 und 1500): die 
flesschen; flesschen; fleschen. — » Gasse. (gazze). > [Qas]: OPF?, 1.19.10: 


113Der Text, der in Firmenichs Völkerstimmen das A im Frankfurterischen beschreibt, ist üb- 
rigens völlig identisch mit dem Wortlaut aus dem Bürger-Capitain (Firmenich 1846b, 62). Das 
legt nahe, Malß als eine Textquelle für Firmenich anzusetzen. 
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Gaß: &. Rau“, 90.1: gas. © Umlaut: Gässi, Dim.: » [e]: OPZ2, 1.45.12: Gässi 
(Dim.). — » Kalb. (kalp). > [kalp/k"alp]: OP?, 1.19.2: Kalb: &. Rau! ‚156: 
kalp, khalp. & Umlaut: Kälber Keen): » [e]?: Op2, 1.28.2: Kölpche (Kälb- 
chen, Dim.). » [ktelv&]: Rau‘, 97.1: khelwä. — » Kasten. (kasten). > 
[kasto]: RAu?, 90.1: kasto. Rauz!, MW: dr&gkasdao. — » Katze. (katze). > 
[k"ats]: OPF?, 1.19.5: Katz: &. Rau‘, 90.1: khats. RAU?, 192: „hell“, „Schul- 
Jugend“. & Umlaut: Kätzi, Dim.: > [k"etsir]: OPF?, 1.253: Kätzi. — » Kraft. 
(kraft). > [kraft]: OPF?, 1.19.5: Kraft: & Rau‘, 90.1: kraft. — » rasch. 
(rasch). > [raf]: OPF?, 1.19.10: rasch: ä&. RAu?, 90.1: ras. — » Tasche. 
(tasche). > [daf]: OPF?, 1.19.10: Dasch: . Rauf, 170.1.b: daö. & Umlaut: 
» [fe]: WüM!, 17 (1320, 1321, 1326 und 1346): Tosschenziecher: Heile Tes- 
sche; tesschinmecher: Guldindesche. OPZ?, 1.47.2: Daschi, Daschercher (Dim.). 
— » Wasser. (wazzer). > [vaz&]: OPF?, 1.19.10: Wasser: a. OPF?, 11.35: 
Wasserche (Dim. Sing.). RAU?, 90.1: wasä. & Umlaut: le]: OPF?, 11.35: 
Wässercher (Dim. Pl.). 


„Big 


4. Zu den altkurzen A vor Nasal vgl. Abschnitt 9.12, Punkte Ic, S. 413. 


9.3.3 Die Kontrastgruppe A im VokalJäger 


Die in diesem Abschnitt untersuchte Kontrastgruppe der kurzen A wird mit der 
Gruppe der kurzen und langen O-Laute kontrastiert: 


A Wörter mit kurzem A in Normalposition: Es handelt sich hierbei um altkur- 
ze, kurzgebliebene A in ehemalig geschlossener Tonsilbe, die auch nicht von 
besonderen Konsonanten gefolgt sind. Das klassische Frankfurterische hatte 
hier kurzes neutrales [a], gleich dem Hochdeutschen (zu anderen A-Lauten 
vgl. Folgekapitel). 


Die Kontrastgruppen A, O und Oz bilden in den folgenden Abschnitten den übli- 
chen Referenzrahmen des VOKALJÄGERS für Untersuchungen mit dem gleitenden 
Merkmal des Öffnungsgrads der Hinterzungenvokale. Sie stellen jeweils eine Seite 
der Kontrastpaare, wenn in den Folgeabschnitten die für den Frankfurter Stadt- 
dialekt eigentlich relevanten A-Laute diskutiert werden. 

Der A-Laut der Kontrastgruppe A sollte sowohl im Frankfurterischen als auch 
im Hochdeutschen neutral mit ( = 4 sein. Da allerdings der VOKALJÄGER auf 
das hochdeutsche [a:] trainiert wurde, sind Abweichungen von diesem Wert auch 
für das Hochdeutsche möglich. Trotzdem wird erwartet, dass die qualitativen Un- 
terschiede der A-Gruppe deutlich und signifikant zu den Gruppen der O-Laute 
bleiben. Für das Kontrastpaar [A0: | ist sowohl im Frankfurterischen als auch 
im Hochdeutschen AG * 2 erwartet - im Paar [A 0] hingegen ein Ad x 5 im 
Dialekt, da ja der kurze O-Laut zum geschlossenen [o] neigt und ein AG = 
der Hochsprache. 

Ein Sprecher bzw. eine Sprachprobe wird als Frankfurterisch markiert, wenn vor 
allem im Kontrastpaar [AO] ein signifikanter Abstand mit Ad > 0,5 gemessen 
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NG AE 
N 0 N 0 
kFra C 4,0 2,0 FraLD cc 4,0 2,5 
N 4,0 N 4,0 
0 2,0 2,0 0 2,5 1,5% 
0: 2,0 2,0 = 0: 20 2,0  (0,5)"s 
NG AG 
N 0 N 0 
HD & 4,0 3,0 FraLC € 4,0 2,9 
N a 4,0 N 4,0 
0 N 3,0 1,0 0 2,9 1,1 
0: 0: 2,0 2,0 1,0 0: 3.0: 280 0,0% 


Tabelle 38: Exemplarische Merkmalswerte C und Merkmalsdifferenzen A( für das 
kurze A (Gruppe A) im Kontrast. — kFra: ideelle Referenzwerte eines Sprechers des 
klassischen Frankfurterischen aus Hauptperiode 4 (1900-1925); HD: entsprechende 
Aussprache im Hochdeutschen. — Messungen mit dem VOKALJÄGER: FraLD: Das 
Frankfurter Lautdenkmal von 1937; FraLC: Sprecherin des Neu-Frankfurterischen, 
hier mit nahezu hochdeutschem Lautmuster. Angesetzt wurde das gleitende Merkmal 
der Öffnungsstufe der Hinterzungenvokale. Die Merkmalswerte liegen im Bereich des 
Erwarteten. Man findet für FraLD ein C = 4,0 [4,0-4,0]. Im Kontrastpaar [A0] 
zeigt sich ein deutlicher Abstand: Für FraLD misst man hier ein AC = 1,5** [1,5-1,5] 
und für FraLC ein AG = 1,1* [1,1-1,1]. Der Wert für FraLD ist größer, da, wie in 
Abschnitt 9.2.3, S.291f., gemessen, die 0-Gruppe von der A-Gruppe zu der Menge 
der Or hin ausweicht (alle Werte in den Tabellen sind mit einer Stelle Genauigkeit 
wiedergegeben; nicht-signifikante originäre AC sind jeweils in Klammern gesetzt und 
stehen für ein endgültiges AC = 0; das Signifikanzniveau ist hochgestellt; Werte mit 
AC® < 0,05 sind als ‚— gedruckt). 


wird. Da diese Erwartung bzw. dieser Abstand dem Hochdeutschen entspricht, 
ergibt sich in diesem Fall pauschal eine Dialektalität d = 0. 

Exemplarische Messwerte des VOKALJÄGERSs für die Merkmalswerte G und die 
Merkmalsdifferenzen AG sind in Tabelle 38 auf S. 301 wiedergegeben. Die vollstän- 
digen Ergebnisse zu ( werden in Abbildung 96 auf S. 303 dokumentiert, wo auch 
die Schwankungsbreiten abgelesen werden können. Die Messungen zu AG finden 
sich in Abbildung 97 auf S. 304. Weitere Zahlenwerte und ein Test auf frankfurte- 
rische Dialektalität hinsichtlich des Kontrastpaars [AO] sind in Tabelle 39 auf 
S.305 gedruckt. Ergänzende Daten zu AC"P liefert Abbildung 144 auf S.480 im 
Anhang. Einzelheiten zum Aufbau der Kontrastgruppen und den (° und (! sind 
ebenso im Anhang ab Abbildung 127, S. 463 f., beigelegt. 
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9.3.4 Diskussion 


Die Öffnungsstufe für die meisten Sprecher, gleich ob Frankfurterisch oder Hoch- 
deutsch, liegt für die Kontrastgruppe der kurzen A (A) bei den erwarteten G 4 
(vgl. Abbildung 96 auf S.303). Für den Sprecher K07MR misst man z.B. ein 
C = 4,0 [4,0-4,0]. Bei den Sprechern K10MR und FraF2L allerdings gibt es deut- 
liche Abweichungen von dem hochdeutschen Wert. Die Ergebnisse sind ( = 3,8 
[3,5-4,0] bzw. € = 3,3 [3,0-3,6]. Allerdings wird — und das ist wesentlich — immer 
ein signifikanter Abstand zwischen der A- und 0- als auch der O- und der O:-Gruppe 
eingehalten. Für das Frankfurter Lautdenkmal beträgt der Abstand im Kontrast- 
paar [AO] AC = 1,5% [1,5-1,5] und im Paar [Aw0:] AC = 2,0** [2,0-2,0]. 
Insbesondere bei Sprecher FraF2L ist zu erkennen, wie das gesamte System rea- 
giert: Hier misst man in dem Kontrastpaar [AO] einen Abstand von AG = 1,1”* 
[0,9-1,1]. Das A mag sich zwar mit einem ( = 3,3 |3,0-3,6] deutlich in Richtung [>] 
bewegt haben, für das man im Hochdeutschen ein ( = 3 erwartet. Doch weichen 
die kurzen O-Laute (0) aus: sie enden auf d = 2,2 [2,0-2,4], nun aber deutlich 
im Bereich der [o:]-Laute, für die hochdeutsches C = 2 gilt. Doch auch die langen 
O-Lauten (Or) bleiben von den kurzen O-Laute getrennt. Für die langen O-Laute 
wird ein ( = 1,8 |1,7-2,0] gemessen — der Wert ist abermals zu niedrigeren ( hin 
ausweichend, aber nun geringer verschoben. Im Kontrastpaar [0 0: | findet sich 
ein signifikanter Abstand von AC = 0,40* [0,23-0,40]. Gerade dieser Sprecher mit 
seinen deutlichen (-Verzerrungen gegenüber dem Hochdeutschen zeigt schön, wie 
robust und flexibel die Methode der sprecherintrinsischen Merkmalsdistanzen des 
VOKALJÄGERS ist — im Ergebnis halten die Realisierungen der A, O und Or bei 
FraF2L immer die für das Hochdeutsche erwartete signifikante Trennung aufrecht. 

Das kurze neutrale A findet sich auch in den ohrenphonetischen Transkripten 
von Broxten (1985) zum Frankfurterischen der 1980er, was den VOKALJÄGER- 
Befund bestätigt!!*. Aus der Sicht eines Dialektforschers ist das neutrale kurze A 
für sich allein genommen nicht besonders interessant. Wichtig ist die A-Gruppe 
vielmehr zusammen mit den O-Lauten als Referenzrahmen für die Vielheit der 
anderen A-Konstellationen in den Folgeabschnitten. Dass die A-Gruppe sich hierzu 
eignet, zeigt sich an den Ergebnissen mit ( * 4. Die Begriffe kurzes A und neutrales 
A werden im Folgenden synonym gebraucht. 


!14]n Broxten (1985, 19 und Veith-Regel Nr. 181) hingegen wird für das kurze A im alten 
Frankfurterisch, bei ihr Stadtmundart I, ein kurzes dunkles (O) (Lemma: Apfel) angegeben, was 
falsch erscheint. Im jüngeren Frankfurterisch, bei ihr Stadtmundart II, vermerkt sie das erwartete 
kurze neutrale A, in ihrer Notation (a). 
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Öffnungsstufe kurzer A-Laut 
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Abbildung 96: Der kurze A-Laut (A) im VOKALJÄGER. Verteilung des gleiten- 
den Merkmals der Öffnungsstufe der Hinterzungenvokale ( für verschiedene Sprecher. 
Anordnung in Gruppen von links nach rechts: LD: Lautdenkmal; HD: Hochdeutsch 
in Auswahl und Mittel; NF: Neu-Frankfurterisch, insbesondere REDE. Das Symbol 
und der unten gedruckte Wert zeigen den Median an, also (; der vertikale Strich 
den (-Interquartilbereich zwischen dem 25%- und 75%-Perzentil. Das obere Zah- 
lenpaar protokolliert die Probenzahl n und Zahl der Stämme w, getrennt mit ‚/‘. 
Die Merkmalswerte entsprechen weitgehend dem hochdeutschen Wert von ( = 4. 
Das gilt auch für das Frankfurter Lautdenkmal (FraLD) mit ( = 4,0 [4,0-4,0]. Für 
den REDE-Sprecher FraF2L findet sich eine massiv reduzierte Öffnung mit € = 3,3 
[3,0-3,6]. 
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Intra-Sprecher-Distanzen: Öffnungsstufe kurzer A-Laut 


cos 
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o2 
@3 
©: 


Signifikanz 
mr 


Ar 
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+ns 
x th 


Abbildung 97: Merkmalsdistanz A( zwischen dem kurzen A-Laut (A) als Refe- 
renz und dem kurzen O-Laut (0) desselben Sprechers als Vergleich (Symbol: Merk- 
malswert C der Referenz; vertikaler Strich und Zahl: originäre Differenz AC bezüg- 
lich des gleitenden Merkmals der Öffnungsstufe der Hinterzungenvokale; das andere 
Ende des Strichs zeigt mit dem Symbol ‚—“ das ( des Vergleichslauts an). Referenz- 
und Vergleichslaut gelten als unterschiedlich, falls die Distanz AC signifikant ist (**: 
hoch signifikant; x: signifikant; ‚Is‘: zu geringe Probenzahl; ‚th‘: Minimaldistanz nicht 
erreicht: ‚ns‘: nicht signifikant). Der COS Parameter misst das Nicht-Überlappen der 
Verteilungen (hier: 1, stark überlappend, bis 4, weitgehend getrennt). Obwohl man- 
che Sprecher deutlich vom hochdeutschen Wert ( = 4 abweichen, ist der Unterschied 
zu den O-Lauten immer signifikant. Das gilt auch für den REDE-Sprecher FraF2L 
mit seinen verzerrten Werten in der A-Gruppe. Das Frankfurter Lautdenkmal hält 
mit AC = 1,5* [1,5-1,5] einen deutlichen Abstand zu der Gruppe O der kurzen 
O-Laute. Zur Gruppe der langen O-Laute beträgt der Abstand Al = 2,0** [2,0-2,0]. 
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A 0 

Sprecher COS nı w Gh m wm & KA a Al % 

FraLD 10 17 8 a0 35 1725 15 * 15 - x 
KG1 09 24 13 A018 8 22 18 # 18 - x 
KG2 10 4 34 95 27 13 * 13 - x 
“IarL 07. 24 IL 38° 28 2 32. 11 nern 
FraF3L 07 26 2 39 4 16 30 09 #09 - x 
FaFL 10 4 1 40 0 2 29 11 * 1Al- x 
FraFAIL 08 17 1 40 3 15 20 20 %* 20 - x 
FraFAaL 08 2 8 a0 8 17 24 16 * 16 - « 
Fafl 09 1 1 40 7 21 30 10 * 10 - x 
FraLC 10 9 7 40 21 13 29 11 * ı1l - x 
"KorMR 08 277 109% 9 50 Le =70 = x 
K09MR 08 24 18 AO 9 9 33 07 #07 - x 
K10MR 05 2 16 38 9 9 3008 ** 08 - x 
K61BE 08 13 1 40 9 9 30 10 * 10 - x 
K62BE 10 12 11 40 9 9 33 07 #07 - % 


Tabelle 39: Beurteilung der Dialektalität des kurzen A-Lauts anhand der Merk- 
malsdistanz AC’ des kurzen A-Lauts (A) und des kurzen O-Lauts (0). Ein für die 
Frankfurter Stadtmundart typisches, signifikantes und dialektales Muster bzw. eine 
binäre Dialektalität wird mit « markiert (Hauptbedingung AG > 0,5; Nebenbedin- 
gung (ı > 3,5;). © misst hier den Merkmalsunterschied zwischen ( der Gruppe A und 
dem ( = 4 des Hochdeutschen. Signifikanzen a: #*: hoch signifikant; x: signifikant; 
‚ls: zu geringe Probenzahl; ‚th‘: Minimaldistanz nicht erreicht: ‚ns‘: nicht signifikant. 
COS: Bhattacharyya-Distanz als Maß für die Trennung der Verteilungen, — 1: ge- 
trennt; n: Probenzahl; w: Zahl der Stämme. Für Werte < 0,05 steht ‚—‘. Alle Sprecher 
haben einen signifikanten Unterschied zwischen kurzem A-Laut und kurzem O-Laut. 
Das gilt selbst für A-Laute, deren ( deutlich vom hochdeutschen (€ = 4 abweichen. Da 
die signifikante Trennung zwischen A und O ein Muster des Frankfurter Stadtdialekts 
ist, aber auch genauso für das Hochdeutsche gilt, ist die Dialektalität 9 = 0. 
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mhd. Hauptperiode 1825 1850 1875 1900 1925 1945 HD 


Ä Frankfurt » 3 a: a: al 
wie Op Mus 
nät, (Wülcker) ao 
drät (Rauh) 5/8 ä ä 
Sachsenhausen 00 0.00. 1 =, 
Te a 
(Rauh) ö 3/8 5/8 
blä, Frankfurt 0 0 fo) 0 au 
Pe L (6) ©): De ee 
(Rauh) ö ö 


Übersicht: Die wichtigsten Lautentwicklungen für das altlange A im Frankfur- 
terischen, wie sie sich aus den Schriftbelegen ergeben (obere Zeile: erschlos- 
sene IPA Lautwerte; untere Zeilen: originale Lautzeichen der Quellen; HD: 
Hochdeutsch). Ergänzt sind die beiden Reliktwörter blau, mhd. blä, und grau, 
mhd. grä. Der Lautwert änderte sich in Frankfurt von einem etwas dunkleren 
[5:]? zu dem dunklen A-Laut [a:]*. In Sachsenhausen blieb er immer eine Stufe 
dunkler. 


9.4.1 Klassisches Frankfurterisch 


Das lange A erschien im Frankfurterischen verdunkelt bzw. wurde velar gespro- 
chen, also mit einem [>]-ähnlichen Klang. Dies trifft zum einen auf A-Laute zu, die 
auf altlanges A zurückgehen und von denen dieser Abschnitt handelt. Zum ande- 
ren betrifft dies altkurze A-Laute, die in offener Tonsilbe gedehnt wurden: diese 
Dehnungs-A bzw. A: werden in Abschnitt 9.5 ab S.319 beschrieben. Die Fälle, in 
denen im Frankfurterischen kurzes dunkles A vorlag, was aus den eben genann- 
ten langen A-Lauten durch Kürzung entstand, folgen in Abschnitt 9.7 ab S. 336. 
Dieses auch als Verdumpfen, Hebung oder Rundung, des altlangen A bezeichne- 
te Muster ist — in verschiedener Ausprägung — für viele hochdeutsche Mundarten 
gültig (Moser [1929, 142£.| und Schirmunski [1962, 212]). Einige zu einem O-Laut 
gewandelte A, wie z.B. nhd. Monat, mhd. mänot, [monat], fanden auch Eingang 
in das Hochdeutsche. Sonst aber blieb das Hochdeutsche, wie z.B. in nhd. Draht, 
mhd. drät, [dra:t], im Gegensatz zum Frankfurterischen, bei dem neutralen A-Laut 
(Paul 2007, 96). 
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9.4.1.1 Der Laut des dunklen A in Frankfurt 


Rauh hörte in Hauptperiode 4 (1900-1925) in Frankfurt für altlanges Ä in der 
Regel langes dunkles A, welches er mit dem Lautzeichen (a) transkribierte. Dieses 
dunkle A hatte eine etwas geschlossenere Mundöffnung als das neutrale A: 


S 


„Die Zungenstellung des (ä) erlangt man, wenn man aus der (a) Lage die hintere Zunge ein 


wenig gegen den weichen Gaumen hebt [...]. Die Lippen sind auf zumindest % der Öffnung 
bei (a) einander genähert, wodurch der verdunkelte Klang des (ä) wesentlich bedingt wird“ 
(Rau: 42.3). 


Das dunkle A war dem offenen O-Laut [>], das ist Rauhs (5), vom Öffnungsgrad 
her sehr ähnlich, wies aber weniger Spannung bzw. Rundung auf: 


„Zur Bildung von (3, 5) wird die Hinterzunge geringfügig stärker gehoben als bei der Erzeu- 
gung von (a). Doch ist die Hervorbringung von (5) vergleichbar mit (a) nicht so sehr von 
dieser geringeren Zungenhebung als vielmehr von der Stellung der Lippen und Mundwinkel 
abhängig. Letztere sind nicht mehr lose sondern gespannt und werden |[...] etwas genähert“ 
(RAU: 43.1). 


Oppel beschrieb das dunkle A als „zwischen“ seinem A- und O-Laut liegend und 
gab ihm die Vokalnummer 11 (OPF: 1.1.1)!"?. Bei Wülcker (1877, 18) heißt es: 


„Das lange 4 wird nirgends in unserer mundart rein gesprochen: ohne ausnahme ist es ein 
zwischen 4 und ö stehender mittellaut geworden und [...] hat in der länge der mittellaut heute 
sich noch allerwärts erhalten.“ 


Entsprechende Verweise auf einen „Mittellaut“ zwischen A und OÖ finden sich auch 
bei Malß (1833b, 113) und Firmenich (1846b, 62). 

Mit dem dunklen A wies das Frankfurterische einen Laut auf, den das Hoch- 
deutsche nicht kennt und der deutlich sowohl vom neutralen [a] als auch vom 
geschlossenem [o] verschieden ist. In dieser Arbeit soll für den dunklen A-Laut 
der Frankfurter Hauptperiode 4, also Rauhs Zeit, das Lautzeichen [a] verwendet 
werden. Die Motivation ist phonetisch-phonologisch. Mit dem Lautzeichen [a] soll 
vor allem der Unterschied zum neutralen A-Laut [a] als auch die Differenz zu dem 
offenen O-Laut [>] markiert werden - eine exakte Identität mit dem IPA-Kardinal- 
[a] ist weder angestrebt noch hauptsächlich. Die phonetische Ähnlichkeit mit dem 
offenen O-Laut [5] lag offensichtlich vor, doch unterschied Rauh beide Laute expli- 
zit: [] ist etwas dunkler als [a] bzw. [a] liegt im Vergleich zu [5] dem neutralen [a] 
in der Vokalqualität näher. Eine andere Begründung für den Ansatz des distink- 
ten A-Lautzeichens [a] in dieser Arbeit ist phonologisch motiviert: es liegen alte 
A-Laute zugrunde. Dieses Vorgehen folgt der klassischen Dialektphonologie, die in 
der Regel für das dunkle A das separate Zeichen (a) verwendet. 


115Der exakte Wortlaut in Oppels erstem Faszikel nennt in diesem Zusammenhang als A-Re- 
ferenzlaut das Monophthongierungs-A, in seiner Notation (&), das nur und nur an dieser Stelle 
mit (a) geschrieben wird. Dieses (a) ist ähnlich aber nicht gleich dem neutralen A und wird hier 
als palatisiertes [a] angesetzt. Eine detaillierte Diskussion des Lautwerts folgt dann in Abschnitt 
9.8 ab 5.351. Oppels O-Referenzlaut, zu welchem das dunkle A in Bezug gesetzt wird, ist das 
geschlossene [o], bei ihm (0). 
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Die Schriftzeichen für den dunklen A-Laut, insbesondere um ihn vom neutra- 
len A zu unterscheiden, sind vielfältig. Wie schon angemerkt, verwendete Rauh für 
den langen dunklen A-Laut das Zeichen (a) und für den kurzen das Symbol (a), 
im Kontrast zum neutralen A, was bei ihm als (a) erscheint. Wülcker (1877, 29) 
nutzte für den langen dunklen A-Laut um 1877 das Zeichen (ao) und für den kurz- 
en dunklen A-Laut (ä). Bei Oppel schwankt die Schreibung des langen dunklen A 
zwischen Markierung mit der Vokalnummer 11, also (a) oder (aa) und A mit über- 
gesetztem O, also (ä); die Kürze hat entsprechend (a) oder (a). In der von Rauh 
verzettelten Fassung des FWBs tauchen auch Doppelmarkierungen mit (a) bzw. 
(a) auf, was die hier verwendete normalisierte Zitationsform für Oppel im Fließtext 
sein soll. In der Mundartliteratur der Zeit bleibt das dunkle A oft unbezeichnet, 
was sicherlich ökonomisch-satztechnische Gründe hatte. Vereinzelte Ausnahmen 
sind Malß (1833b, 67), der zwei exemplarische Markierungen mit (ä) druckte. Fir- 
menich (1846b) hat in „einigen [...] Proben beispielhalber ein (a) gewählt“ und der 
Mundartdichter Battenberg (1880) schrieb (ao) für das lange dunkle A. 

Vor -N nasalierte altlanges Ä deutlich, wie etwa in [gedä:] für getan. Der Laut- 
wert dieses Nasalierungs-A ist gleich dem des nasalierten Monophthongierungs-A 
und wird in Abschnitt 9.8 ab S. 351 im Detail besprochen. 


9.4.1.2 Die Vororte 


Hatte nun Frankfurt in Hauptperiode 4 für das altlange A das dunkle Dehnungs- 
[ar], war die Situation in den Vororten fundamental verschieden: Vorherrschend 
war in Sachsenhausen um 1920 ein offenes [5:] oder [or], auch noch bei der jungen 
Generation'"®. Für einzelne Wörter merkte Rauh an: „Von alten Sachsenhäuser 
Gärtnern habe ich geschlossenes (o) gehört“ (Rau: 111). Der so bei Rauh aus der 
älteren Generation in Apparent-Time erschlossene Laut [o:] für das Sachsenhausen 
der Hauptperiode 3 (1875-19000) bestätigt sich vollständig Real-Time durch Op- 
pels Aufzeichnungen aus der Hauptperiode 2 (1850-1875): Oppel hörte durchweg 
„reines“ O beim Sachsenhäuser und dunkles A beim Frankfurter. „Aber je älter die 
Leute sind und je mehr wir uns von der Stadt entfernen, desto dumpfer wird der 
a-Laut. Die Verdunklung geht so weit, daß das o ganz geschlossen klingen kann“ 
(Freiling 1924, 192). „Jedem aber, der in die umgegend kommt, wird es auffal- 
len, wie die bäuerliche bevölkerung das a sehr entschieden als mittelding zwischen 
a und o spricht“ (Wülcker 1877, 18). Eckenheim, Eschersheim, Bonames, Praun- 
heim, Heddernheim, Ginnheim, Niederursel, Hausen, Rödelheim, und Niederrad 
hatten [o:]; Preungesheim und Berkersheim noch durchgehend geschlossenes [o:] 
und Seckbach sowie Oberrad gar noch nasaliertes [ü:] für A vor auslautendem N 
(Rau: 7£.). Während Rauh keine dieser [ü:]-Formen mehr in Sachsenhausen hörte, 
waren sie zu Oppels Zeiten noch vorhanden, wie z.B. in [[pü:sav] für Spansau. 
Dieses geschlossene [o:] für A ist typisch für das nähere Zentralhessisch!!7. Das- 


116Das sind Rauhs Teuthonista (5) und (9). 
117 Hier sei mit Zentralhessisch nur die Variante des Frankfurter Umlands bezeichnet. Das fernere 
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selbe gilt auch für das Südhessische bzw. das ganze Frankfurter Umland (Born 
[1938, 81], Schnellbacher [1963, 380] und Wiesinger [1980, 91-92]). Friedberg, Ha- 
nau und Darmstadt hatten allerdings im frühen 20. Jahrhundert allesamt Frank- 
furt gleich [a:] oder [>:] für altlanges A, von einigen Ausnahmen abgesehen (Reuß 
[1907], Urff [1926, 6] und Born [1938, 19]). Die Stadtmundarten hatten sich hin- 
sichtlich des altlangen A vom Land abgekoppelt und regional angeglichen (vgl. 
auch Abschnitt 9.5.1.2 ab S. 320). 


9.4.1.3 Lautwandel des dunklen altlangen Ä 


Für das Frankfurterische liegen Rauhs Beobachtung zum Apparent-Time-Laut- 
wandel des dunklen A aus Ä vor. Er merkt an, dass „die älteren Leute |[...] für 
mhd ä noch einen entschieden dunkleren Laut als (a), also (5) oder (o) sprechen“ 
(RAu: 110) und: „|...] spricht die mittlere Generation (a), die ältere jedoch (o), d.h. 
einen stärker verdunkelten Laut“ (Rau: 22). Wülcker und Oppel machen keinerlei 
Aussagen zu einem Lautwandel — wichtig ist ihnen nur sowohl der Unterschied des 
dunklen A zum neutralen A als auch zum O. Der Lautwert des dunklen A aus Ä 
scheint in den betreffenden Hauptperioden 1 bis 3 (1825-1900) also stabil gewesen 
zu sein. Aus diesen Informationen kann man schließen, dass A in Rauhs Hauptpe- 
riode 4 (1900-1925) einen eher A-lastigen und in den vorangehenden Perioden 1 
bis 3 einen eher O-lastigen Klang gehabt hatte. Entsprechend sei für diese Arbeit 
pauschal das dunkle altlange A in Rauhs Hauptperiode 4 mit [a] und in Oppels 
sowie Wülckers Hauptperioden 1 bis 3 mit [5] angesetzt!!®. Der Lautansatz mit [>] 
für das dunkle A im 19. Jahrhundert deckt sich mit Oppels Beobachtungen: Oppel 
verwendet dieselbe Vokalnummer, die 11, für altes U oder O, das vor R zu offenem 
[5] geöffnet wurde und für das dunkle A - nur die Grapheme unterscheiden sich 
mit (o) und (a) (vgl. Abschnitt 9.2.1 ab S.287). Der Lautwandel von [>] auf [a] 
wird, Rauhs Beobachtungen folgend, mit dem Wechsel von Hauptperiode 3 auf 4 
postuliert. In der gesamten Zeit war [a] bzw. [5] vom neutralen [a] als auch vom 
geschlossenen [o] unterschieden. 

Nun stellt sich natürlich die Frage, was der ursprüngliche Lautwert des Frank- 
furter Ä war. Es liegt nahe, ihn mit langem geschlossenen O, also [o:], anzusetzen. 
Zum einen ist dies der regelmäßige Lautwert der umliegenden Mundarten. Zum 
anderen aber kommen einige wenige indirekte Belege in Frankfurter Reliktwörtern 
vor. Das sind Wörter, bei denen der ursprüngliche Laut des alten Ä konserviert 
wurde: Das Hochdeutsche durchlief in der Vokalentwicklung abgekoppelt eine an- 
dere Entwicklung. Es hatte kein A mehr und konnte somit nicht als eine Referenz 
dienen, an die sich die Frankfurter Stadtmundart hätte orientieren können. Es gibt 
nur zwei eindeutige Reliktwörter, in denen sich das postulierte ursprüngliche [o:] 
noch erhalten hatte, nämlich nhd. blau, mhd. bla, kFra. [plo:], und nhd. grau, mhd. 


Zentralhessisch der Wetterau hatte mit Alles (1953, 23) für A neben [or] auch [uro] und [ur]. 
118 Vorausgreifend sei angemerkt, dass dies insbesondere auch im Einklang mit den Ausführun- 
gen zum Dehnungs-A im 19. Jahrhundert steht (vgl. S. 320). 
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grä, kFra. [kro:]. „au wird 0 nur in blo und gro, sonst, wie es scheint, nirgendwo“ 
(OPF: IL.110). Diese Reliktformen doch häufig genutzter Wörter starben im ak- 
tiven Sprachgebrauch in Hauptperiode 5 aus und erhielten sich nur in stehenden 
Begriffen wie [plormerl&], das sind Blaumale, etwa: blaue Flecken. Sonst wurde 
der hochdeutsch übliche Diphthong genutzt, etwa in hellblau, [helplav]’. Andere, 
aber möglicherweise nicht ganz sichere Belege für konserviertes altes A, sind die 
haben-Flektionen, die auf A zurückgehen und schwankend in der Mundart auch [o] 
aufweisen — sie werden in Abschnitt 9.7.1 ab S. 337 besprochen. Ebenso schwankt 
das A in z.B. nhd. mal, mhd. mäl, kFra. [ma:l] bzw. [moil]. 


„Die Entwicklung von mhd. ä ging nach geschlossenem o. Ob [...| mhd. & bereits dazu gewor- 
den war oder ob [...] der Laut nur bis zu einem halbgeschlossenen o kam und unter Einfluß der 
Schriftsprache zurückgewandelt wurde, kann heute nicht mehr gesagt werden“ (Rau: 110). 


Wie sich in Abschnitt 9.4.1.1, S. 321, zeigen wird, sprechen auch die unterschied- 
lichen Umlaute von altlangem A und Dehnungs-A für die Hypothese, dass einst 
wohl [o:] vorlag. 

Zur Entwicklung in jüngerer Zeit kann natürlich nichts aus den alten Schrift- 
belegen abgelesen werden. Es wird sich aber aus den Untersuchungen mit dem 
VOKALJÄGER in Abschnitt 9.4.4 ab $S.315 zeigen, dass das lange dunkle [a:] im 
Neu-Frankfurterischen verschwunden ist, was sich mit Broxten (1985) deckt. Die 
hier gemachten Bemerkungen zum Lautwert und Lautwandel des dunklen altlan- 
gen Ä treffen ebenso zu auf das dunkle Dehnungs-A, das dann in Abschnitt 9.4.1.1 
ab S. 307 besprochen wird. 


9.4.2 Ausgewählte Schriftbelege 


1. Altlanges A in Normalposition: 


Ä > []? < [a]! - [a] > hafa) _ 

» Abend. (äbent). > [sıvnt]”: OPF?, 1.19.3: Awend: a. > [armnt/a:vnt]?: 
RAU“, 155, Anm. 1: amnt, äwnt. RAU“, 155, Anm. 1: ämnds, äwnds. Rau25%, 
76: nämnt (guten Abend). RAU25%, 78: faiäamnt (Feierabend). > [a:]’: BRO’, 
SpB, 35: arband. © Oberrad: D [o:]**: FR25°%: Oowend. © Seckbach, Preun- 
gesheim, Berkersheim: > [ormnt]*: Rau*, 7.1: ömnt. — » blasen. (bläsen). 
> [plo:zo]?: OPF?, 1.19.10: blase: ä. OPF?, 1.450: bläst (bläst). > [pla:zo]*: 
Rau“, 160.1: plaso. ® Ableitung: Blase (bläse): » [pla:s]*: OPF?, 1.19.10: Blas: 
ä. RAU“, 109.1: plas. RAUZ°: bläs. © Umlaut: Bläsi, Dim.: » [ple:zi:]?: OPZ2, 
11.18.13: Bleesi. © Sachsenhausen: D [plo:s]”: OPF?, 11.334: Bloos, „bei de- 
nen das a im Sachsenhäuserischen reines 00 ist |...]. Wenigstens sagt der (alte) 
Sachsenhäuser regelmäßig und sicher |...]. Die ganze Sache wäre noch genauer 
zu untersuchen “. — » Braten. (bräte). > [pra:do]”: OPZ?, 1.23.15: Bräte. > 
[pra:do]*: Rau, 109.1: prädo. © Umlaut: Brätchen, Dim.: » [er]: OPZ2, 
1.26.9: Preedche. © Sachsenhausen: > [o:]?: OPZ?, I1.15.5: Bröte. — » da. 
(dä). & [da:]?: OPF?, 1.330: da. > [da:]*: Rau‘, 111: da. © Sachsenhausen: 
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> [do:]?: Rau?, 111: dö. > [dor]"?: RaAu%®, 111: 5, 9. © Seckbach, Preunges- 
heim, Berkersheim: D [do:]*: RaAu?, 7.1: dö. — » Draht. (drät). > [tro:t]?: 
OPZ?, 1.31.11: Trot dorch de Hinnern ziehe. > [tra:t]*: Rau?, 109.1: trart. © 
Sachsenhausen: D [tro:t]"®: OPZ?, 1.31.11: Tröt. Rau?, 111: tröt. > [trart]"®: 
RAu®®, 111: 5, 9. — » fragen. (vrägen). > [fraryo]: MaAB°, 11, 12: froge, 
gefrogt. TE°: loß mich gefrogt were. OPF?, 1.19.7: Frage: ä. OPF?, 1.403: fräch 
(Imp.). © Umlaut: er fragt: » [frer3t]: MAB°: was fregst du. Rau*, 98.1: frest. 
— » Jahr. (jär). > [jo:]”: OPF?, 1.19.1: Jahr (ä). OPZ?, 1.49.14: die Jährn, drei 
Jähr. > [ja:]*: Rau, 109.1: ja. & Umlaut: Jährchen, Dim.: » [er]: OPZ?: 
Jehrche. © Sachsenhausen: > [o:]?: OPZ?, 1.32.13: Jar. — » Haar. (här). 
> [har]: OPZ2, 1.47.2: Haar. OP?: Häärn (Pl.). > [haz]*: Rau“, 109.1: ha. © 
Umlaut: Häärchen, Dim.: [ei]: OPZ?, 1.47.2: Heerche, Heerercher (Sing. Pl.). 
© Sachsenhausen: D [hore]”®: OPZ?, 11.21.14: Hoor, „reines O“. RAu?, 111: 
hör. D [5:/o:]"?: Raut®, 111: 5, 9. — » malen. (mälen). > [ma:lo]: OPZ2, 
1.56.5: mäle. > [marlo]*: Rau?, 109: mälo. — » nach. (näch). > [naıx]?: 
OPF?, 1.19.7: nach: ä. > [na:x]*: Rau, 109.1: nax. — » Nadel. (nädel). > 
Ina:dl]?: OPF?, 1.19.5: Nadel: ä. OPZ?, 1.49.3: Haanädele. > [na:dl]*: Rau‘, 
109.1: nädl. © Sachsenhausen: D [or]: OPZ?, II.6.6: Nödel. — » Naht. (nät). 
> [nart]*: Rau“, 109.1: nat. © Umlaut: nähen: » [nerjo]”*: OPZ?, 1.11.15: 
nehe. RAU‘, 113.1: neio. © [ne:jo]’: RAU?, 19: n&io. — » paar. (pär). > [51]?: 
OPF?, 1.19.1: Paar: &. & Umlaut: Päärchen, Dim. Pl.: » [er]! /[e:]?: OPZ?, 
11.11.14: „Päär, Pheerche scheint die alte Form für das jetzt üblich gewordene 
Phäärche ä“. — » plagen. (plägen). > [5:]?: OPF?, 1.19.7: Plag: a (Plage). 
> [plaryo]*: Rau“, 109: plaxo. — » Schaf. (schäf). > [Jo:f]?: OPF?, 1.235: 
Schäaf. > [fa:f]*: RAu*, 109.2: säf. @ Umlaut: Schäfer: » [er]: OPF?, 1.71: 
Schefer. OPZ?, 11.21.14: des Scheefche (Schäfchen, Dim.). © Sachsenhausen: 
> [Joıf]?: OPF?, 1.235: Schoof. OPF?, 11.334: Schoof, „reines 00“ (vgl. Eintrag 
für Blase). — » schlafen. (släfen, släf). > [Jlo:vo]®*: OPF?, 1.19.5: Schlaf, 
schlafe: ä. OPF?, 1.359: geschlaafe. > [fla:vo]*: Rau‘, 109.1: slävo. Rau‘, 
164.2: slafrok (Schlafrock). & Umlaut: Schläfchen, Dim.: © [er]: OPF?, 11.334: 
des Schleefche, „Diminutiv, entspricht 6“. © Sachsenhausen: » [Jlo:f]: OPF?, 
11.334: Schloof, „reines oo“ (vgl. Eintrag für Blase). © Seckbach, Preunges- 
heim, Berkersheim: D [florfo]: Raut, 7.1: Slöfo. — » Sprache. (spräche). 
> [Jpro:x]”*: OPF?, 1.19.7: Sprach: a. BAT®: Sproach. > [fpra:x]*: Rau’, 
109.1: Sprax. — » Strafe. (sträfe). D [Straf]: OPF?, 1.19.5: Straf ä. > 
[Stra:f]*: Rau“, 109.1: straf. — » Straße. (sträze). D [Strass]: OPF?, 
1.19.10: Straak: ä&. > [Stra:s]*: Rau?, 109.1: Sträs. — » wahr. (wär). > 
[vo:]?: OPF?, 1.19.1: wahr: ä. BAT?: lebenswoahr. > [var]*: RAu?, 109.1: wa. 


2. Altlanges A vor historisch auslautendem -N: 


Ä-Nn > [3] + [a]? > hd.[a,] 
» getan. (getän). D [gedär]': RAut, 109.1: goda. © Preungesheim, Berkers- 
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heim: D [edör]*: Rau?, 7.1: godo. © Seckbach: > [gedür]*: Rauf, 7.1: 
godu. — » Span. (spän). D [pr]: OP?: Späänsau. RauUZ?, WH: Sbörsau. © 
Bornheim, Sachsenhausen: > [[pür]: OPZ?, II.24.15: Spü(n)sau. RAUZ°?, WH: 
sbü:sau, „die alten Bornheimer sagen noch heute“. © Preungesheim, Berkers- 
heim: > [[pür]*: Rauf, 7.1: Sp”. 

3. Reliktwörter: 
A> [eo] > hd.[av] 
» blau. (blä). > [plo:]: OP?: Mim bloe Aach dervo(n)komme. OPZ?, T1.110: 
Blökittel (Blaukittel). OrZ?, 11.23.4.14: Ploomeeler (Blaumale: blaue Flecken). 
OP2Z?, 1.23.7: plitzplö (blitzblau). RAuv*, 109.2: plö, plöomelä. RAU25°: plitsoplo. 
RAuUZ?, FB: bis se blo werd. er is blo. Bloonas. Bloomääler. > [plau]’: RAu25t, 
83: helplau. © Umlaut: bläuen:  [ple:jo]: OPZ?, 1.36.3: Blee (Bläue). RAU?, 
113: pleio. — » grau. (grä). > [kro:]: OPF?, 1.384: krö. OPZ?, I1.110: 
Grököpp (Graukopf: alter Mann). RAU*, 109.2: krö. RAUZ?: kritsokro. 


4. Schwankende Lautbilder: 
Ä > [a] + [ar/o]? »> hd.[a:] 
» mal. (mäl). > [mail]’: OPF?, 1.5 Pkt. 30: emöl. > [ma:l/mol:]*: Rau‘, 
109.4: omöl, amäl, „schwankend “. 


5. Behandelt im Abschnitt über verkürzte dunkle A sind: 


» du hast. (häst). S. 344. — » er hat. (hät). S. 344. — » gebracht. (gepräht). 
S. 341. — » gehabt. (gehät). S. 344. 


9.4.3 Die Kontrastgruppe Ä im VokalJäger 


Die in diesem Abschnitt untersuchte Kontrastgruppe der altlangen A wird mit der 
Gruppe des kurzen neutralen A und den Gruppen der kurzen und langen O-Laute 
kontrastiert: 


Ä Wörter mit altlangem und lang gebliebenem Ä: Das klassische Frankfurte- 
rische hatte hier dunkles A, [a:]* bzw. davor [5:]?, das Hochdeutsche hat 
neutrales [a:] (zum Dehnungs-A vgl. Abschnitt 9.5 ab S.319 und zum ge- 
kürzten Ä vgl. Abschnitt 9.7 ab S. 336). 


Wörter mit altlangen Ä bilden die erste Kontrastgruppe aus A, bei der im Frankfur- 
terischen ein signifikant anderes Verhalten als im Hochdeutschen zu erwarten ist: 
altlange Ä, die lang geblieben sind, verdunkelten im Frankfurter Stadtdialekt!'?. 


119Dje Zuordnung von Wörtern mit langem A entweder zu der Gruppe der altlangen Ä (Ä) oder 
alternativ zu der Gruppe der Dehnungs-A (Az) ist in Einzelfällen nicht immer ganz eindeutig, 
da unbekannt ist, ob im Frankfurterischen des frühen Mittelalters ursprünglich altlanges A oder 
altkurzes A in Dehnung vorlag. Da aber der Lautwert von altlangem Ä und Dehnungs-A für 
das klassische Frankfurterische in Hauptperiode 4 gleich war, ist diese Frage eher nachrangig. 
Diese Arbeit folgt in der Zuordnung im Allgemeinen Rauh (1921a, 8117 und $109f.) und ergänzt 
gegebenenfalls aus Umlaut-[e:] rückerschlossene Ä (vgl. Abschnitt 9.5.1.3, S.321f.). 
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Für das Frankfurterische der Hauptperiode 4 ist in der Gruppe der altlangen A 
der Lautwert [a:] zu erwarten, also ein C = 3 auf der Öffnungsstufe der Hinterzun- 
genvokale, wenn man die Ähnlichkeit zu dem Laut [>] als Basis ansetzt. 

So ist mit dem VOKALJÄGER zweierlei zu vermessen: Ist die Öffnungsstufe 
der Ä signifikant unterschiedlich zu der der kurzen A-Laute? Technisch ist das die 
Analyse des Kontrastpaars [AA]: In diesem Paar wäre für das Frankfurterische 
ein AC = 1 bzw. zumindest ein AC > 0 zu erwarten, was sich aus der Merkmals- 
differenz von [a] und [a:] ergibt. Für das Hochdeutsche sind der kurze A-Laut, 
[a], und der lange A-Laut, [az], der sich ja hier für altlanges Ä findet, qualitativ 
identisch: Für einen hochdeutsch geprägten Sprecher sollte AC = 0, bzw. Al <1 
sein. Das Kontrastpaar [AA] gibt eine Antwort auf eine Fundamentalfrage: Hatte 
der Frankfurter Stadtdialekt ein zweites, ein dunkles, ein velares A? Dann wäre 
das dunkle A ein wesentliches — wenn nicht sogar das wesentliche — Identifikations- 
merkmal des Frankfurter Stadtdialekts. Und: hat dieses dunkle A überlebt? Lässt 
es sich in neueren Sprachproben noch messen? 

Die zweite wichtige Frage ist: wenn altlanges A verdunkelt und somit signifikant 
unterschiedlich zum kurzen neutralen A ist, fällt es im Frankfurterischen mit den 
O-Lauten zusammen? Ist das dunkle A ein Zwischenlaut? Es wird erwartet, dass 
verdunkeltes A im Frankfurterischen der Hauptperiode 4 etwa ein C = 3 hatte bzw. 
[>]-ähnlich war — der nächstähnliche O-Laut war der der Gruppe O-rC mit (3 
bzw. [5]. Das Problem mit der Gruppe O-rC ist jedoch ihre dünne Population in den 
hier vorliegenden Messungen, was naturgemäß die Aussage in dem Kontrastpaar 
[Ä>0-rC] einschränkt (vgl. Abschnitt 9.2.3 ab S.291). So sollen hier vor allem 
die Gruppen der kurzen und langen O-Laute, also O und O:, herangezogen werden, 
für die beide im Frankfurterischen ( = 2 war. Technisch ist dies die Untersuchung 
der Kontrastpaare [ÄA>0] und [Ar 0: ]. 

Ein Sprecher bzw. eine Sprachprobe wird als Frankfurterisch markiert, wenn 
vor allem in den Kontrastpaaren [AA] und [0x “Ä] jeweils ein signifikanter 
Abstand mit Al > 0,5 gemessen wird. Als hinreichende Nebenbedingung soll für 
die Kontrastgruppe A ein C < 3,5 gelten, also ein tendenziell dunkleres A. 

Exemplarische Messwerte des VOKALJÄGERS für die Merkmalswerte G und die 
Merkmalsdifferenzen AG sind in Tabelle 40 auf S. 314 wiedergegeben. Die vollstän- 
digen Ergebnisse zu ( werden in Abbildung 98 auf S. 316 dokumentiert, wo auch 
die Schwankungsbreiten abgelesen werden können. Die Messungen zu AC finden 
sich in Abbildung 99 auf S. 317. Weitere Zahlenwerte und ein Test auf frankfurte- 
rische Dialektalität hinsichtlich des Kontrastpaars [AA] sind in Tabelle 41 auf 
S.318 gedruckt. Ergänzende Daten zu AC"P liefert Abbildung 145 auf S.480 im 
Anhang. Einzelheiten zum Aufbau der Kontrastgruppen und den (° und (! sind 
ebenso im Anhang ab Abbildung 128, S. 464f., beigelegt. 
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ANG AG 
A Ä 0-rC A Ä 0-rC 
kFra C 4,0 30 3,0 FraLD ( 40 33 35 
A a 4,0 a 4,0 
Ä ai 3,0 1,0 Ä 3,3 0,7** 
0-rC ) 3,0 1,0 - 0-rC 3,5 (0,5)8 (0,2)" 
o 20 2,0 1,0 1,0 0 2:5: 1,5% 10,8 (6,0)8 
: Pop 20 2,0 1,0 1,0 0: >20. 20 1,3 
NG Al 
A Ä 0-rC A Ä 0-rC 
HD C 4,0 40 3,0 FraLC C 40 38 34 
A a 4,0 a 4,0 
Ä al 4,0 = Ä 3,8 (0,2)"° 
0-rC b) 3,0 1,0 1,0 0-rC 34 0,6* (0,4)"8 
0 6) 3,0 1,0 1,0 = 0 2.9: 1 09°. 065 
0: [op 20 20: +20 1,0 0: 30- a0 er, 


Tabelle 40: Exemplarische Merkmalswerte ( und Merkmalsdifferenzen A( für das 
altlange Ä (Gruppe A) im Kontrast. —kFra: ideelle Referenzwerte eines Sprechers des 
klassischen Frankfurterischen aus Hauptperiode 4 (1900-1925); HD: entsprechende 
Aussprache im Hochdeutschen. —Messungen mit dem VOKALJÄGER: FraLD: Das 
Frankfurter Lautdenkmal von 1937; FraLC: Sprecherin des Neu-Frankfurterischen, 
hier mit nahezu hochdeutschem Lautmuster. Angesetzt wurde das gleitende Merk- 
mal der Öffnungsstufe der Hinterzungenvokale. Für FraLD misst man ein ( = 3,3 
[3,0-3,8], womit der Lautwert dieses ‚dunklen‘ A wie erwartet tendenziell in Richtung 
[>] bzw. C = 3 geht. Im Kontrastpaar [AA] findet sich mit AG = 0,7** [0,7-0,7] 
eine signifikante Differenz, ebenso im Paar [A0] mit AC = 0,8** [0,8-1,3]. Dies 
bestätigt das dunkle A als einen ‚Mittellaut‘ zwischen A und O. Das dunkle A ist 
bei der neu-frankfurterischen Sprecherin FraLC nicht mehr auffindbar: Im Kontrast- 
paar [AA] misst man mit Al = 0 aus Al = (0,2)"5 [0,2-0,2] keinen Unterschied 
mehr (alle Werte in den Tabellen sind mit einer Stelle Genauigkeit wiedergegeben; 
nicht-signifikante originäre AC® sind jeweils in Klammern gesetzt und stehen für ein 
endgültiges AC = 0; das Signifikanzniveau ist hochgestellt; Werte mit Al’ < 0,05 
sind als ‚— gedruckt). 
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9.4.4 Diskussion 


Die altlangen A verdunkeln eindeutig im Frankfurter Lautdenkmal: Man misst 
eine Öffnungsstufe von € = 3,3 [3,0-3,8] und, wichtiger, die Gruppe Ä ist hoch 
signifikant und mit einer Merkmalsdifferenz AC® = 0,7** [0,7-0,7] deutlich von der 
Gruppe der kurzen A getrennt. Zu der Gruppe der kurzen O-Laute (0) beträgt 
die Differenz Al = 0,8* [0,8-1,3]. Mit der Gruppe der [>]-ähnlichen 0O-rC scheint 
Ä erwartungsgemäß mit AC = 0 aus AC’ = (0,2) [0,2-0,2] zusammenzufallen, 
doch, wie schon angemerkt, ist diese Gruppe zu klein, um verlässliche Aussagen 
zu treffen. Eine deutliche Differenz AC = 1,3* [1,0-1,3] wird zur Gruppe der 
langen O-Laute gemessen. Damit ist eindeutig das dunkle A aus altlangem A im 
Frankfurter Lautdenkmal ein Laut zwischen den kurzen A-Lauten und den O- 
Lauten, insbesondere zwischen dem neutralen [a] und dem geschlossenen [o]. Dies 
deckt sich mit den Schriftbelegen bzw. den Beschreibungen von Rauh, Wülcker 
und Oppel sowie Malß und anderen. Der Lautwert ist mit einem ( < 3 leicht 
vom [5] zum [a] hin abweichend — genauso, wie erwartet. Ohne Bedenken kann die 
phonetisch-phonologische Schreibung [a:] für das altlange A im Frankfurterischen 
angesetzt werden. 


Für den Sprecher KG1 im Klein-Gerauer Lautdenkmal wird in der Ä-Gruppe 
eine noch geringere Öffnungsstufe mit C = 2,5 [2,4-4,0] gemessen, was schon in 
Richtung eine Lautwerts von [o:] bzw. € = 2 geht. Allerdings bleibt die A-Gruppe 
hier noch von der O:-Gruppe mit Ad = 0,50* [0,41-0,50] signifikant getrennt, so 
dass man für KG1 keinen Zusammenfall altlanger Ä mit den O-Lauten im geschlos- 
senen [o:] finden kann. Die tendenzielle Richtung von Ä zu [o:] war ein Muster des 
zentral- bzw. südhessisch geprägten Frankfurter Umlands, kontrastiv zu dem der 
Stadt, die ja [a:] anstatt [o:] hatte. Interessanterweise findet man bei dem ver- 
meintlichen Sprecher des Neu-Frankfurterischen FraFAlL exakt dieses Muster der 
Annäherung an [o:]. Man misst ein Cd = 2,6 [2,3-3,2]. Die Annäherung ist ausge- 
prägt, denn die Ä- und O:-Gruppen lassen sich mit AC = 0 aus Al? = (0,6)"® 
[0,3-0,6] nicht mehr signifikant trennen. Folglich findet man bei FraFAIL ein Indiz 
für einen weniger frankfurterisch denn zentralhessisch geprägten Dialekt. 


Für alle anderen Sprecher des Neu-Frankfurterischen ergibt sich dasselbe Bild 
wie für die hochdeutschen Sprecher: das dunkle A für altlanges A ist nicht mehr 
belastbar nachweisbar — es hat ein Merger mit dem neutralen A stattgefunden. 
Zwar sind manche Öffnungsstufen von € = 4 abweichend, doch trennen die A und 
A Gruppen niemals mehr signifikant. Auch sind die ( -Werte nicht signifikant von 
den hochdeutschen Merkmalswerten für [a] oder [a:] unterschieden. Der hochdeut- 
sche Sprecher K10MR hat mit ( = 4,0 [4,0-4,0] einen Wert, der dem des neutralen 
A völlig gleich ist — entsprechend misst man auch einen Zusammenfall im Kon- 
trastpaar [a»az] mit AC = (0,2)"® = 0 |0,2-0,5]. Für die Frankfurter Sprecherin 
FraLC, bei der es sich möglicherweise um Liesel Christ handelt, zeigt sich ein dem 
Hochdeutschen analoges Bild: Die Messung liefert d = 3,8 [3,6-4,0] und AC = 0 
aus AC = (0,2)"° [0,2-0,2]. 
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Öffnungsstufe altlanges Ä 
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ag 225335 SL LL LU 
CEO OS SS 5 DO ISIS ISIOSS HS 
LESE EEE Sc Tec ı 


Abbildung 98: Das altlange A im VOKALJÄGER. Verteilung des gleitenden Merk- 
mals der Öffnungsstufe der Hinterzungenvokale ( für verschiedene Sprecher. Anord- 
nung in Gruppen von links nach rechts: LD: Lautdenkmal; HD: Hochdeutsch in Aus- 
wahl und Mittel; NF: Neu-Frankfurterisch, insbesondere REDE. Das Symbol und 
der unten gedruckte Wert zeigen den Median an, also (; der vertikale Strich den 
G-Interquartilbereich zwischen dem 25%- und 75%-Perzentil. Das obere Zahlenpaar 
protokolliert die Probenzahl n und Zahl der Stämme w, getrennt mit ‚/‘. Für manche 
Dialektsprecher liegt das ( des altlangen A deutlich eher im Bereich des [5] (C = 3) 
als im Bereich des [a:] (GC = 4). Das Frankfurter Lautdenkmal (FraLD) weist mit 
G= 3,3 [3,0-3,8] einen deutlich [>]-ähnlichen Laut auf. 


Auch Broxten (1985, 26) fand in ihren jüngeren und mittelalten Sprechern im 
Frankfurt der 1980er kein langes dunkles A mehr!?®. Sie notierte: „Das dumpfe a 
[...]| konnte ich nur noch bei älteren Sprechern beobachten, die Frauen in meinem 
Sample sprachen alle offeneres helles a“. 


Man kann also schließen, dass das dunkle A für altlanges A im alten Frankfurter 
Lautdenkmal noch messbar ist - im Neu-Frankfurterischen ist es verschwunden. 


120Das Verschwinden des dunklen A-Lauts im Neu-Frankfurterischen wird von ihr mittels Veith- 
Regel Nr. 180 codiert: Für das ältere Frankfurterische, bei ihr Stadtmundart I, wird ein langes 
dunkles A angesetzt, bei ihr in Veithscher Notation (O); für das lange jüngere A ein neutraler 
A-Laut, in Veith-Notation (A). 
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Intra-Sprecher-Distanzen: Öffnungsstufe altlanges Ä 
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Abbildung 99: Merkmalsdistanz A( zwischen altlangem Ä als Referenz und dem 
Dehnungs-A, den A- und O-Lauten (hier: A, 0, O-rC und Or) desselben Sprechers 
als Vergleich (Symbol: Merkmalswert ( der Referenz; vertikaler Strich und Zahl: 
originäre Differenz AC® bezüglich des gleitenden Merkmals der Öffnungsstufe der 
Hinterzungenvokale; das andere Ende des Strichs zeigt mit dem Symbol ‚—“ das ( 
des Vergleichslauts an). Referenz- und Vergleichslaut gelten als unterschiedlich, falls 
die Distanz AC® signifikant ist (**: hoch signifikant; x: signifikant; ‚ls‘: zu geringe 
Probenzahl; ‚th‘: Minimaldistanz nicht erreicht: ‚ns‘: nicht signifikant). Der COS 
Parameter misst das Nicht-Überlappen der Verteilungen (hier: 1, stark überlappend, 
bis 4, weitgehend getrennt). Für manche Dialektsprecher ist das altlange A signifikant 
unterschiedlich zum kurzen A (A). Es fällt gar bei FraFA1L mit dem langen O-Laut 
zusammen (Oz). Das Frankfurter Lautdenkmal (FraLD) hält mit AG = 0,7** [0,7-0,7] 
eine deutliche Distanz zu der Gruppe A der neutralen A. 
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Sprecher COS n wı Gh m wm & A a A 9 
FraLD 07 7 8 40 19 7 33 07 * 0707 x 
KG1 Ir 28.180 2er 6 
KG2 06 A 3 AO 5 2 3703 SS - - 


FaPfL 038 aM 1 33 1308 
FafL 01% 2 39 1 5 
FraflL 04 4 140 W 7 
FraFAiL 05 7 1 406 4 26 14 * 14 14 @) 
FraFA2L 03 2 Ss 40 76 
Fafl 04 1 1 40 5 5 
66 


K07MR 04 24 17 40 7 5 4,0 — ns — 
K09MR 04 24 18 40 8 6 4,0 = ns — 
K10MR 05 22 16 38 8 6 40 02 ns - — 
K61BE 03 13 1 40 5 4 40 = ns — 
K62BE 04 12 1 40 5 4 40 — ns — 
I A 
FraLD 07 7 9 20 19 733 13 * 13 13 x 
KG1 0,7 6 6..:20. Is: 2 25.05 9 xD > 
KG2 1,0 3 3 18 5 2 37 19 * 19 - 


FraF2L 09 293 23 18 23 8 
FraF3L 0,7 21 2 20 21 5 
FraF4L 10 19 11 20 10 7 
FraFAIL 04 17 2 206 A 26 06 ns - => 4) 
FraFA2L 10 16 13 2,0 6 
5) 
6 


KOMR,. 10 1. 8590 zz 5 40 20 eo 
KOOMR 10 1 8 20 8 6 40 20 * 20 - 
K0OMR 10 1 8 20 8 6 40 20 * 20 - 
KlBE 10 6 6 20 5 4 40 20 * 20 - 
KeaBE 106 6 20 5 A 40 20 * 20 - 


Tabelle 41: Beurteilung der Dialektalität des altlangen A anhand der Merkmalsdi- 
stanz AC des kurzen A (A) und des altlangen A. Ein für die Frankfurter Stadtmund- 
art typisches, signifikantes und dialektales Muster bzw. eine binäre Dialektalität wird 
mit « markiert (Hauptbedingung Al > 0,5; Nebenbedingung (2 < 3,5;). d misst hier 
den Merkmalsunterschied in der Kontrastgruppe [AA] bzw. [0x »A]. Signifikanzen 
a: »*: hoch signifikant; x: signifikant; ‚Is‘: zu geringe Probenzahl; ‚th‘: Minimaldistanz 
nicht erreicht: ‚ns‘: nicht signifikant. COS: Bhattacharyya-Distanz als Maß für die 
Trennung der Verteilungen, — 1: getrennt; n: Probenzahl; w: Zahl der Stämme. Für 
Werte < 0,05 steht ‚—. Die Sprecher FraLD, KG1 und FraFAIL zeigen einen signifi- 
kanten Unterschied zwischen kurzem A und altlangem Ä. Unten: Es gibt einen für das 
Frankfurterische unüblichen Zusammenfall im Kontrastpaar [A>0:] bei FraFA1L. 
Widersprüchliche Dialektmarkierungen sind mit (x) bzw. ( ) angezeigt. 
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Übersicht: Die wichtigsten Lautentwicklungen für das dunkle Dehnungs-A im 
Frankfurterischen, wie sie sich aus den Schriftbelegen ergeben (obere Zeile: er- 
schlossene IPA Lautwerte; untere Zeilen: originale Lautzeichen der Quellen; HD: 
Hochdeutsch). Der Lautwert änderte sich in Frankfurt von einem O-lastigen [>:]? 
zu dem dunklen A-Laut [a:]*. In Sachsenhausen blieb er konstant auf der Stufe 
des [52]. 


9.5.1 Klassisches Frankfurterisch 


Langes A, welches durch Dehnung aus altkurzem A entstand, das sogenannte 
Dehnungs-A oder abgekürzt A:, war im Frankfurterischen verdunkelt, also zum [>:] 
hin gewandelt. Zugrunde liegt derselbe Lautformungsprozess, wie bei dem schon 
beschriebenen langen dunklen A, welches auf altlanges Ä zurückgeht (vgl. Ab- 
schnitt 9.4.1 ab S.306). Hauptsächlich betrifft die Dehnung altkurzes A, das in 
historisch offener Tonsilbe stand, so z.B. in nhd. sagen, mhd. sa-gen. Diese Deh- 
nung in offener Tonsilbe bzw. hier das Entstehen eines Dehnungs-A, ist für die 
meisten hochdeutschen Mundarten als auch das Hochdeutsche prägend. Im Zu- 
sammenhang mit dem Dehnungs-A wird die oft einhergehende Verdunklung auch 
als ein Verdumpfen beschrieben (Moser [1929, 116£.], Schirmunski [1962, 181£.] 
und Paul [2007, 80]). Dunkles Dehnungs-A konnte auch in geschlossener Tonsilbe 
durch Analogie zu Flektionsformen, die eine offene Tonsilbe aufweisen, entstehen, 
so 2.B. nhd. Saal - Saales, mhd. sal < sa-les. Allerdings sind hier die Unterschiede 
zwischen dem Hochdeutschen und den Mundarten vielfältiger (Paul 2007, 82). 


9.5.1.1 Das Dehnungs-A des Frankfurter Stadtdialekts 


Dieser Abschnitt beschreibt die Dehnungs-A, die ihre Länge beibehalten haben. 
Laute, die ursprünglich gedehnt bzw. lang waren und danach verkürzten, sind in 
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Abschnitt 9.7.1 ab S.337 behandelt. Da im Frankfurterischen die dunkle Klang- 
färbung des A in der Regel an die Länge des Vokals gebunden ist, kann eine solche 
Verkürzung auch eine Änderung der Klangfarbe des dann kurzen Vokals von ur- 
sprünglich dunkel auf neutral bewirken. Das betrifft auch A vor -RT, die in demsel- 
ben Abschnitt 9.7.1 beschrieben werden und A vor -LT, die sich in dem separaten 
Abschnitt 9.9 ab S.375 finden. 

Das Dehnungs-A blieb im Frankfurterischen konstant über alle Perioden dun- 
kel. Der Lautwert des dunklen Dehnungs-A war in Frankfurt völlig identisch zu 
dem des langen dunklen A, welches aus altlangen Ä entstanden ist — die Lautbe- 
schreibung aus Abschnitt 9.4.1, S. 306 f., gilt entsprechend. Rauh setzte für beide 
lange A in Periode 4 (1900-1925) denselben Lautwert (ä) an (RAu: 90.3 und 109.1). 
Das Gleiche gilt auch für Oppel in Hauptperiode 2 (1850-1875), der für beide aus- 
nahmslos Vokalnummer 11 nutzte, also (ä). Die Belege Oppels für den gleichen 
Lautansatz sind umso wichtiger, als dass er sich — aufgrund seiner fehlenden ger- 
manistischen Vorbildung — des Unterschieds zwischen gedehntem A: und altlangem 
A nicht bewusst war: aber genau diese Unvoreingenommenheit macht seine Laut- 
belege gerade an dieser Stelle so wertvoll (vgl. Abschnitt 7.2.2, $. 242f.). In jeder 
Hauptperiode war also in Frankfurt der Lautwert des Dehnungs-A: gleich dem des 
altlangen A. Wahrscheinlich änderte sich aber für beide zusammen der Lautwert 
zwischen Oppels und Rauhs Zeit und somit ergibt sich zwischen Hauptperiode 
2 bzw. 3 und Hauptperiode 4 ein absoluter Unterschied. Dies lässt sich aus den 
Apparent-Time-Belegen Rauhs erschließen. Genauso wie beim altlangen A hörte 
Rauh bei der älteren Generation einen deutlich dunkleren Laut für das Dehnungs- 
A: „Die alten Leute sprechen |...] einen noch stärker verdunkelten Laut als (a), er 
entspricht (9)“. Der Lautwert blieb dann stabil: „Die jüngste Generation hingegen 
gebraucht |...] überall da wo mhd. a gedehnt wurde (ä) |...“ (RAu: 93). 

So soll hier dem Dehnungs-A in Hauptperiode 4 (1900-1925) und Periode 5 
(1925-1945) der Lautwert [a:] zugewiesen werden. Für Hauptperiode 3 (1850- 
1875) und davor sei als Lautwert [5:] angenommen - völlig analog dem dunklen 
altlangem Ä (vgl. Abschnitt 9.4.1, S. 306 £.). 


9.5.1.2 Das Dehnungs-A der Vororte 


Der Lautwert des Dehnungs-A in Sachsenhausen in Hauptperiode 4 war unter- 
schiedlich zum Frankfurterischen: 


„In der Aussprache des mhd. a unterscheidet sich der Sachsenhäuser von dem Frankfurter. 
Selbst die Schuljugend in Sachsenhausen spricht [...| noch einen deutlich dunkleren, dem o 
näherliegenden a-Laut als der Frankfurter, so daß die jetzige allgemein übliche Aussprache 
in Sachsenhausen derjenigen der alten Frankfurter gleicht“ (Rau: 94). 


Rauh setzt ein () an und entsprechend soll hier ein [5:] als IPA Lautwert für das 
Dehnungs-A in Sachsenhausen verwendet werden. Oppel hörte keinen Unterschied 
zwischen Frankfurter und Sachsenhäuser Dehnungs-A, was mit obigem Lautansatz 
des Frankfurter Dehnungs-A für Hauptperiode 2 stimmig ist: In dieser Periode 
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sprach sowohl der Frankfurter als auch der Sachsenhäuser dunkleres [o:] für das 
Dehnungs-A. 

Der Zusammenfall des Dehnungs-A: und des altlangen Ä in nur einem Laut, 
dem langen dunklen [ar], wie er für Frankfurt vorherrschte, ist symptomatisch für 
die umliegenden Städte der Zeit. Die Landmundarten der Region hingegen trennen 
lautlich A: von altlangem Ä und haben für letzteres einen dunkleren Wert!?*. 


9.5.1.3 Ergänzung: Der Umlaut des A: und des Ä 


Obwohl auf unterschiedliche alte Laute zurückgehend, hatten zumindest ab 1800 
das Frankfurterische Dehnungs-A: und das altlange A dieselbe Aussprache, nämlich 
langes dunkles [a:]? bzw. [5:]?. Dass sie einst wohl unterschiedlich waren, lässt sich 
nur noch in ihren Umlauten erkennen: Dehnungs-A hatte bis in Hauptperiode 4 
hinein offenes [e:] als Umlaut, z. B. [ha:s] — [hezzi:] für der Hase - das Häschen oder 
[na:s] — [ne:zir] für die Nase - das Näschen. Ausnahme ist, wenn der Umlaut schon 
in althochdeutschen Zeiten als Primärumlaut vorgelegen hat, also als das A noch 
nicht gedehnt war. In dieser Konstellation wurde der Primärumlaut gedehnt und 
dem Dehnungs-A stand ein alter gedehnter Primärumlaut als Umlaut gegenüber: 
der Lautwert war langes geschlossenes [er], z.B. [kla:s] - [kle:zi:] für das Glas - 
das Gläschen. Altlanges Ä lautete ebenfalls mit geschlossenem [e:] um, z.B. [pla:s] 
— [plerzir] für die Blase - das Bläschen. Somit kann aus dem Umlaut abgelesen 
werden, auf welchen A-Altlaut langes dunkles A im Frankfurterischen zurückgeht. 
Auch ist der Umlaut ein indirekter Beleg für das hypothetisch angesetzte [o:] des 
altlangen A im Frankfurterischen, denn aus unterschiedlichem Umlaut folgt ein 
ursprünglich unterschiedlicher Lautwert des Stammvokals. Diese unterschiedlichen 
Lautmuster bewegten Oppel so sehr, dass er dazu eine kleine Notiz Unser zweierlei 
A anfertigte (OPF: 11.334), die auch mit Riese (1920, 43) im FWB abgedruckt ist. 
In den eingangs beschriebenen Umlaut-Mustern notierte Oppel sauber (€), also [e:], 
für den Umlaut des altlangen A und (ä), also [e:], für den Umlaut des Dehnungs-A:. 
Er vermerkte keinerlei Unterschiede im Grundvokal, der in beiden Fällen mit (ä) 
niedergeschrieben wurde. 

An diesem Beispiel zeigt sich auch deutlich die Unvoreingenommenheit Oppels. 
Die direkte Erklärung, die ein Germanist vorbringen würde, nämlich die Herkunft 
aus A: bzw. Ä, war ihm offensichtlich nicht bekannt: Sein genauso richtiges, aber 
indirektes Erklärungsmodell für den geschlossenen Umlaut (&), also [e:], ist das 
Vorhandensein eines (0), also [o:], für den Grundvokal in Sachsenhausen. Genau 
dieses [o:] liegt aber im Sachsenhäuser Zentralhessische nur bei altlangem A vor: 


121Dije Ortsgrammatiken berichten exemplarisch wie folgt (in originaler Schreibung): Friedberg 
hatte für Ar und Ä den Laut (aa) (Reuß 1907). Hanau hatte für A: in Stadt und Land den 
Laut (5). A war in Hanau (5), aber auf dem Land, in dem Ort Mittelbuchen, (6) (Urff 1926, 6). 
Darmstadt hat für Ar in Stadt und Land den Laut (ä). A war in Darmstadt (ä), aber auf dem 
Land (ö) (Born 1938, 19 und 81). Mainz hingegen hatte für Ä einen leicht dunkleren Laut, in 
Teuthonista (5), als für Ar, (a) (Valentin 1934, 16, 33). Das Mainzer Land hatte für altlanges Ä 
den Laut (6). 
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„Es scheint (und dies kann vielleicht als Anhaltspunkt dienen), daß diejenigen (6e) haben, 
bei denen das a im Sachsenhäuserischen reines 00 ist; die übrigen nicht. Wenigstens sagt der 
(alte) Sachsenhäuser regelmäßig und sicher: [...| die Bloos [=Blase; ...| u. dgl. während ich 
mich nicht erinnere, jemals der Hoos [=Hase; ...] gehört zu haben, sondern (auch jenseits 
des Mains) immer der Häs [=Hase; ...|. Die ganze Sache wäre noch weiter zu untersuchen“ 
(OPF: 11.334). 


9.5.2 Ausgewählte Schriftbelege 


1. Dehnung in historisch offener Tonsilbe: 


A > [2] + [art + [a]” > hd.[ar] 

» Fahne. (fane). > |foın]?: OPF?, 1.19.9: Fahn: a. > [faın]*: Rau‘, 90.3: 
fan. — » fahren. (varn). > [*ar]': WÜM!, 18 (1432): foren. WÜM!, 19 (1460): 
forporten (Fahrpforte). D [51]: OPF?, 1.19.1: fahre: & & Umlaut: er fährt 
(vert): » [faeret]: RAU?, 97.2: f&%*t. © Ableitung: Fahrt (vart): D& [fort]?: OPF?, 
1.19.1: Fahrt: ä&. > [fart]*: Raut, 90.3: fat. — » Hase. (hase). > [ha:s]”®: 
OPF?, 1.19.10: Has: ä. OPZ?, 1.25.8: Has. > [ha:s]*: Rau‘, 90.3: has. RAUZ?, 
GK: ha:s. © Umlaut: Häsi, Dim.: © [hezzir]: OPF?, T1.334: Häsi, „immer 3“. © 
Sachsenhausen: D [ho:s]?: OPZ?, I1.21.4: Häas, „Niemals reines 6“. — » jagen. 
(jagen). » [jo:yo]”: 1.19.7, OpF: jage: a. © Umlaut: Jäger: » [eı]?: OPZ?, 
1.12.8: Jägerlatein. & Ableitung: Jagd (jaget): > [jaxt]”: OPF?, 1.19.7: Jagd: a. 
> [jaxt]*: Rau*, 207: jaxt. — » Magen. (mage). > [maorya]?: OPF?, 1.19.7: 
Mage: a. > [marya]*: RAU, 90.3: maxo. — » Nase. (nase). > [ns:s]?: OPF°, 
1.19.10: Nas: &. > [na:s]*: RAu!, 90.3: nas. — » nagen. (nagen). > [ns:yo]?: 
OPF?, 1.19.7: nage: a. > [na:yo]*: RAu?, 90.3: naxo. — » Rahmen. (rame). 
> [Roım]?: OPF?, 1.19.8: die Rahm: ä. OPZ?, 1.17.5: „Rähm (F.)“. OP2Z?, 
11.31.10: Fensterrähm. © Sachsenhausen: > [:]: OPZ?, TI.18.9: „ganz sicher 
in SH a in Rahm nicht 12“. — » sagen. (sagen). > |soryo]”: OPF”, 1.385: 
sache. RAuU?, 93: 9. > [saryo]*: Rau?, 165.1: saxo. RAu!, 190: saxm (sag 
ihm!). & Ableitung: > [5]?: OP?: gesächt. RAu?, 93: 3. © Umlaut: er sagt, du 
sagst: » [eı]?: MAB°, 22: des seegt mer so. OPZ?, 1.31.1: daß du deß da segst. 
» [se:fst, serft]: Rau?, 207: sesst (du sagst). RAU?, 98.1: s&st (er sagt). » 
[sejst, seft]’: Rau?, 207: sesst, sest, „erst in letzter Zeit“. > [ksaxt]!: Rau“, 
190.1.b: ksaxt. > [ksaxt]’: Rau?, 93: a. © Oberrad: > [5]**: FR25%%, WS9: 
gesaocht. — » schlagen. (slahen). > [flo:ya]?: OPF?, 1.19.7: schlage: ä. OPF°, 
1.403: göschlache. OP?: wenn er dich schläächt, „vornehm Frankfurterisch “. > 
[a:]: Bro’, SpC, 25: gofla:xn. & Ableitung: Schlag (slac): > [flax];: Raut, 
210.a: Slax. (slege). © Umlaut: Schläge: » [fle:f]; OPZ?, 1.10.3: Anschleeg 
(Anschläge). Rau, 97.1: 3les. » [fle:f]’: Rau, 18: 3les. — » Tafel. (tavel). > 
[d>:vl]?: OP?: Däfel. > [da:vl]?: Raut, 175.1: davl. — » tragen. (tragen). > 
[troryo]?: OPF?, 1.19.7: trage: a. > [tra:yo]*: RAU, 90.3: traxo. © Umlaut: 
Träger: » [tre:3&]:. RAu*, 98.1: tresä (Träger). — » Ware. (ware). > [»:]?: 
MaB°, 67: Währ. Op?: Wäär, Wäarn. 
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2. Analogiedehnung in historisch geschlossener Tonsilbe: 


A-C > [5]? [a]? > ha.lar 

» Glas. (glas). > [klo:s]?: OPF?, 1.19.10: Glas: ä. OPF?, 1.565: Glas. > [kla:s]?: 
RAU“, 210.a: klag. © Umlaut (altes E): Gläsi, Dim.: » [klezir]: OPF?, 11.334: 
Gleesi, „immer 4!“. © Sachsenhausen: D [»:/or]: OPF?, 11.334: „Von Glas bin 
ich mir nicht sicher, ob [der alte Sachsenhäuser] Gloos mit reinem 0 oder Gläs 
sprechen würde“. — » Grab. (grap). D [kro:p]”: OPF?, 1.19.3: Grab: ä&. > 
[kra:p]?: Rau“, 210.a: kräp. © Umlaut: Gräber: » [kreıv&]: RAUH?, 98.1: 
krewä. — » Gras. (gras). > [krois]”: OPZ?, 1.25.16: Gras. OPF?, 1.19.10: 
Gras: &. > [kra:s]*: Rau“, 90.3: kräs. & Umlaut: Gräsi, Dim.: » [kre:zi:]: 
OP2Z?, 11.21.14: Gräsi. — » Rad. (rat). > [roıt]”: OPF?, 1.19.5: Rad: ä. > 
[ra:t]*: Rau*, 210.1: rät. & Umlaut: Räder (reder): » [red&]: OPZ2, 
11.21.9: „Statt Rötter sagt die etwas jüngere Generation regelmäßig Rätter, 
während es bei den alten Leuten noch heißt das Räd die Retter“. — [re: de]: 
OPZ?, 1.7.11: „die Reder. Räder ist moderne Nebenform “. n [re: d&]*: Rau“, 
98.1: ee n [re: {al Rau! ‚98.1: r&tSo (Rädchen, Dim.). — » Saal. (sal). 
> [so:l]?: MAB?: Saal. OPF2, 1.19.2: Saal: a. & Umlaut: Säälchen, Dim.: 
[e:]: OPF?, II.334: Sälche, „3° (> > Tag. (tae). > [do]? MAB®: Dag. 
OPF?, 1.19.7: Daach: a. > [da:x]*: Rau“, 90.3: dax. © Umlaut: Tage: » [ex]: 
OPF?, 1.22: die Dech. — » Wahl. (wal). = [vo:l]?: OP?: die Wäl ik e Qual. 


3. Analogiedehnung in geschlossener Tonsilbe vor historisch auslautendem -N: 


(a)Ar-n > [55° + [a]? > ha.lar] 
» an, heran. (ane). > [äa:]*: Rau, 90.3: a. — » Zahn. (zan). > [tsär]*: 
Rau’, 90.3: tsa. © Umlaut: Zähne: » [tsei]?: OPZ?, 1.22.16: Zeh. RAu', 
97: tse, „mundartlich “. » [tse:]’: Rau?, 97: tse, „halbmundartlich “. 


(b) A-N > [1]? + [a]? > hd.lar] 
>» Hahn. (han). > [51]?: OPF?, 1.19.9: Hahn: a. & Umlaut: Hähnchen, 
Dim.: © [ei]: OPZ?, 11.21.14: Hehnche. — » Schwan. (swan). > [[vo:n]?: 
OPF°?, 1.19.9: Schwan: a. D [fvarn]?: Rau‘, 90.3: Swan. 


4. Dehnung vor historischem -R: 


A-R > [21]? + [ar]? > hd.f[ar] 

» Arm. (arm). > [sm]: OPF°?, 1.19.1: arem: &. Op2?, 1.47.3: arm, är&mch, 
äremcher (Sing.; Dim. Sing.; Dim. Pl.). > [arm]*: Rau‘, 90.3: am. © Umlaut: 
Ärmel (ermel): » [ereml]: OPZ?, 1.47.3: ar&mche, är&ıncher, „scheint beide 
gleich gebräuchlich “ (umgelauteter Dim. Sing.: Dim. Pl.; ; vgl. auch nicht umge- 
lautete Form oben). RAau?, 90.3: &"!ml. — » gar. (gar). & [92:]?: OPF?, 1.19.1: 
gar: ä&. > [da:]*: Rau“, 90.3: ga. — » garn. (gar). > [gom]?: OPF?, 1.19.1: 
Garn: ä&. OPZ?, 1.40.6: Gärn. > [Qa:n]*: Rau‘, 211.2.a: gän. — » warm. 
(warm). & [varm]?: OPF?, 1.19.1: warem: ä&. > [varm]*: Rau“, 90.3: wa. 
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5. Die vor historischem -R und Konsonanten gedehnten altkurzen A sind denen, 
die verkürzen, beigestellt: 


» Bart. (bart). Vgl. Bart auf 5.342. — » Fahrt. (vart). Vgl. Fahrt auf S. 322. 


9.5.3 Die Kontrastgruppe Ar im VokalJäger 


Die untersuchte Gruppe der Dehnungs-A wird mit dem kurzen neutralen A, den 
kurzen und langen O-Lauten sowie dem altlangen A kontrastiert: 


A: Wörter mit ehemalig altkurzem A und dann gedehntem und lang geblie- 
benem A: Das klassische Frankfurterische hatte hier dunkles A, [a:]! bzw. 
davor [5:]?, das Hochdeutsche hat neutrales [a:] (zum gekürzten Dehnungs- 
A vgl. Abschnitt 9.7 ab S. 336). 


Wörter mit Dehnungs-A sind eine weitere Kontrastgruppe, bei denen im Frankfur- 
terischen ein signifikant anderes Verhalten für A als im Hochdeutschen zu erwarten 
ist: Dehnungs-A verdunkelten im Frankfurter Stadtdialekt. Was das Frankfurt der 
Hauptperiode 4 (1900-1925) betrifft, war der A-Laut des Dehnungs-A identisch 
mit dem Laut des altlangen A — beide hatten [a:], was einem ( *= 3 entsprechen 
sollte. Folglich sind die Tests mit dem VOKALJÄGER auch völlig analog zu denen 
aus Abschnitt 9.4.3, S.312£.: Es wird insbesondere mit dem Kontrastpaar [A»A: ] 
hinsichtlich der Öffnungsstufe der Hinterzungenvokale gemessen, ob eine signifi- 
kante Differenz zum neutralen A vorliegt. Mit den Kontrastpaaren |Ar © 0-rC], 
[Az O0] und [Ar 0: | wird überprüft, ob ein Zusammenfall mit den O-Lauten 
eintritt. Die Erwartungshaltung wurde in Abschnitt 9.4.3, S. 312f., eingeführt und 
ist in den Tabellen weiter unten wiederholt. 

Ein weiterer wichtiger Test soll jedoch ergänzt werden: die Untersuchung des 
Kontrastpaars [Az »A]. Die Hypothese ist, dass Dehnungs-A und altlanges Ä im 
Laut [a:] bzw. auf C & 3 zusammenfallen. Somit ist in dem Kontrastpaar [Ar A] 
ein Al = 0 erwartet — was übrigens auch für das Hochdeutsche gilt, das für bei- 
de Laute [a:] hat; nur ist in der Hochsprache ( = 4 anstatt dem (C = 3 Frank- 
furterischen. Der Zusammenfall von Dehnungs-A und altlangem Ä war typisch 
Frankfurterisch. Im näheren Umland waren diese beiden Laute getrennt. Während 
Dehnungs-A dort [>:] hatte, tendierte Ä zu [or]. 

Ein Sprecher bzw. eine Sprachprobe wird als Frankfurterisch markiert, wenn 
vor allem in den Kontrastpaaren [A»A:| und [O: A: | jeweils ein signifikanter 
Abstand mit AG > 0,5 gemessen wird. Als hinreichende Nebenbedingung soll für 
die Kontrastgruppe Ar ein C < 3,5 gelten, also ein tendenziell dunkleres A. 

Exemplarische Messwerte des VOKALJÄGERS für die Merkmalswerte ( und die 
Merkmalsdifferenzen AG sind in Tabelle 42 auf S. 326 wiedergegeben. Die vollstän- 
digen Ergebnisse zu ( werden in Abbildung 100 auf S. 327 dokumentiert, wo auch 
die Schwankungsbreiten abgelesen werden können. Die Messungen zu AC finden 
sich in Abbildung 101 auf S. 328. Weitere Zahlenwerte und ein Test auf frankfurte- 
rische Dialektalität hinsichtlich der Kontrastpaare [A»Arz]| und [Or Az | sind in 
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Tabelle 43 auf S.329 gedruckt. Ergänzende Daten zu ACH? liefert Abbildung 146 
auf S.481 im Anhang. Einzelheiten zum Aufbau der Kontrastgruppen und den (® 
und (' sind ebenso im Anhang ab Abbildung 129, S. 465 f., beigelegt. 


9.5.4 Diskussion 


Gleich den altlangen A verdunkeln auch die Dehnungs-A im Frankfurter Laut- 
denkmal, der Mittelpunktswert des Öffnungsgrads ist mit C = 3,35 [3,29-3,48] 
sogar nahezu identisch, was nicht unerwartet ist, werden beide ja im klassischen 
Frankfurterisch mit demselben Lautwert [a:] angesetzt. Die Merkmalsdifferenz zur 
Kontrastgruppe der kurzen neutralen A beträgt Al = 0,7“ [0,7-0,7]| und ist signi- 
fikant. Dasselbe gilt mit den Differenzen zur O- und zur O:-Gruppe: die Abstände 
AC = 0,87 [0,81-0,87] bzw. AC = 1,35”* [1,29-1,35] sind signifikant. Erwartungs- 
gemäß scheint ein Zusammenfall mit der Kontrastgruppe 0O-rC vorzuliegen: Al = 0 
aus AC? = (0,13) [0,13-0,19], aber die Probendichte ist gering. Genauso wie für 
die Gruppe Ä und mit gleicher Argumentation ist der Laut-Ansatz der Gruppe 
Az mit [a:] gerechtfertigt. Der Test im Kontrastpaar [Ar "Ä] ergibt ebenfalls den 
erwarteten Effekt: Beide Gruppen fallen zusammen: Zwischen Dehnungs-A und 
altlangem A ist mit AC = 0 aus Al? = (0,04)" [0,00-0,06] im Frankfurter Laut- 
denkmal kein signifikanter Qualitätsunterschied zu messen. 

Die Sprecher KG1 und KG2 des Lautdenkmals aus Klein-Gerau weisen ebenso 
einen signifikant verdunkelten Laut auf, genauso FraFAlL. Man misst für die drei 
Sprecher ( = 3,0 [2,43,5], € = 2,5 [2,2-2,7] und d = 3,0 [2,1-3,0]. Auch für diese 
Sprecher gilt, dass kein signifikanter Unterschied in dem Kontrastpaar [Ar A] 
feststellbar ist: Es ergeben sich AC = 0 aus AC’ = (0,5)" [0,0-0,6], AC = 0 aus 
AC® = (1,2)" [1,2-1,4] und AC = 0 aus AC® = (0,4)"S [0,0-0,9]. Für den Sprecher 
FraFAlL kristallisiert sich nun mehr ein eher zentralhessisch als frankfurterisch 
geprägtes Klangbild heraus: Während das Frankfurterische für Dehnungs-A und 
altlanges Ä nur einen Laut [a:] hatte, erwartet man im Hessischen offenes [»:] in der 
Kontrastgruppe Az und geschlossenes [o:] in der Ä-Gruppe. Zwar kann für FraFA1L 
kein Unterschied im Paar [Ar »A] gemessen werden. Eine indikative Tendenz fin- 
det sich aber in den Abständen zur Kontrastgruppe O:- die Differenz AC = 1,0* 
[0,1-1,0] ist im Paar [Ar 0: | signifikant, aber nicht im Paar [Ä 0: |, wo man ein 
AC = 0 aus Al? = (0,6)"S [0,3-0,6] findet. So liegt für FraFAlL eher eine Tendenz 
der Ä-Gruppe zum [o:] vor, die sich so in Kontrastgruppe Ar nicht findet. Das ist 
aber Zentralhessisch und nicht Frankfurterisch. Für alle anderen Sprecher des Neu- 
Frankfurterischen und Hochdeutschen findet sich kein distinktives langes dunkles 
A mehr, weder im Dehnungs-A noch im altlangen A. Für den hochdeutschen Spre- 
cher K61BE misst man z. B. in der Kontrastgruppe Az ein C = 4,0 [4,0-4,0] und der 
REDE-Sprecher weist ein C = 3,7 [3,4-4,0] auf. Im Kontrastpaar [A Az] findet 
man Al = 0 aus AC” = (0,0)"° [0,0-0,0] bzw. Al = 0 aus AC? = (0,4)" [0,4-0,7]. 
Obwohl die Merkmalswerte der Kontrastgruppen Ä und A: deutlich von dem hoch- 
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AC Al 

A A: Ä A A: Ä 
kFra @ 4,0 30 30 FraLD ( 40° 3:3. :.88 
A a 4,0 a 4,0 
Ar a: 3,0 1,0 A: 3,3  0,7* 
Ä ai 3,0 1,0 - Ä 33: 0,0%. (CS) 
0-rC ) 30.10 - - Dre 3,6, %(0,5)8 .(0,1)° 0,2)8 
0 o 2,0 2,0 1,0 1,0 0 25, - 1,5 10,9 0 
0: 0: 2,0 2,0 1,0 1,0 0: 20. 20° 1,99 1,3% 

AC Al 

A A: Ä A A: Ä 
HD C 40 30 30 FraLC ( 40 40 3,8 
A a 4,0 a 4,0 
A: al 4,0 = Az 4,0 (-)” 
Ä a: 4,0 - - Ä 3,8. (0:2) 1052) 
bSrG > 3,0 1,0 1,0 1,0 0-rC 34 0,6* (0,6)"$ (0,4)"8 
0 2) 3,0 1,0 1,0 1,0 0 9,96 E10 0,98 
0: 0: 20° , 20. 20 20 0: 2:07 220° 2.0 13# 


Tabelle 42: Exemplarische Merkmalswerte ( und Merkmalsdifferenzen A( für das 
Dehnungs-A: (Gruppe Ar) im Kontrast. — kFra: ideelle Referenzwerte eines Sprechers 
des klassischen Frankfurterischen aus Hauptperiode 4 (1900-1925); HD: entsprechen- 
de Aussprache im Hochdeutschen. —Messungen mit dem VOKALJÄGER: FraLD: Das 
Frankfurter Lautdenkmal von 1937; FraLC: Sprecherin des Neu-Frankfurterischen, 
hier mit nahezu hochdeutschem Lautmuster. Angesetzt wurde das gleitende Merk- 
mal der Öffnungsstufe der Hinterzungenvokale. Für FraLD misst man ein € = 3,35 
[3,29-3,48], was dem € = 3,3 [3,0-3,8] für das dunkle A aus altlangem A faktisch 
identisch ist (vgl. Abschnitt 9.4.3, S.312f.). Entsprechend findet man im Kontrast- 
paar [A»A:] mit Al = 0,7** [0,7-0,7] einen signifikanten Unterschied und im Paar 
[Ar A] mit AC = 0 aus AC® = (0,04)"$ [0,00-0,06] keinen. Für die neu-frankfurte- 
rischen Sprecherin FraLC ergibt sich mit ( = 4,0 [3,8-4,0] der Wert des neutralen A 
und im Kontrastpaar [A A: ] ist mit AC = 0 aus AC® = (0,0)"$ [0,0-0,0] kein Unter- 
schied messbar: Das dunkle A ist verschwunden (alle Werte in den Tabellen sind mit 
einer Stelle Genauigkeit wiedergegeben; nicht-signifikante originäre AC® sind jeweils 
in Klammern gesetzt und stehen für ein endgültiges AC = 0; das Signifikanzniveau 
ist hochgestellt; Werte mit AC < 0,05 sind als ‚— gedruckt). 
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Öffnungsstufe Dehnungs-A 
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Abbildung 100: Das Dehnungs-A (Kontrastgruppe Ar im VOKALJÄGER. Ver- 
teilung des gleitenden Merkmals der Öffnungsstufe der Hinterzungenvokale ( für 
verschiedene Sprecher. Anordnung in Gruppen von links nach rechts: LD: Lautdenk- 
mal; HD: Hochdeutsch in Auswahl und Mittel; NF: Neu-Frankfurterisch, insbesonde- 
re REDE. Das Symbol und der unten gedruckte Wert zeigen den Median an, also (; 
der vertikale Strich den C-Interquartilbereich zwischen dem 25%- und 75%-Perzentil. 
Das obere Zahlenpaar protokolliert die Probenzahl n und Zahl der Stämme w, ge- 
trennt mit ‚/‘. Für manche Dialektsprecher ist das Dehnungs-A deutlich abweichend 
vom hochdeutschen [a:] (mit ( = 4) und liegt eher im Bereich des [>] (mit C = 3). 
Das Frankfurter Lautdenkmal hat mit einem ( = 3,35 [3,29-3,48] eine deutliche 
Verschiebung in Richtung des [>]-Lauts. 


deutsch erwarteten ( = 4 abweichen, sind diese Differenzen nicht signifikant — es 
ist davon auszugehen, dass der Neu-Frankfurter das ehemalig lange dunkle A nun 
als neutrales A spricht, ununterscheidbar von den A-Lauten, die er für das kurze A 
nutzt. Für den Neu-Frankfurter bilden die Gruppen A, Az und Ä keinen Kontrast 
mehr — es hat ein Merger mit dem neutralen A stattgefunden. Des Weiteren gilt 
auch alles für das altlange A Gesagte entsprechend (vgl. Abschnitt 9.4 ab S. 306). 
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Intra-Sprecher-Distanzen: Öffnungsstufe Dehnungs-A 
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Abbildung 101: Merkmalsdistanz AC zwischen dem Dehnungs-A (Kontrastgrup- 
pe Ar) als Referenz und den A- und O-Lauten (A, A, 0, 0O-rC und Or) desselben 
Sprechers als Vergleich (Symbol: Merkmalswert ( der Referenz; vertikaler Strich und 
Zahl: originäre Differenz AC® bezüglich des gleitenden Merkmals der Öffnungsstu- 
fe der Hinterzungenvokale; das andere Ende des Strichs zeigt mit dem Symbol ‚— 
das ( des Vergleichslauts an). Referenz- und Vergleichslaut gelten als unterschied- 
lich, falls die Distanz AC® signifikant ist (**: hoch signifikant; x: signifikant; ‚Is: zu 
geringe Probenzahl; ‚th‘: Minimaldistanz nicht erreicht: ‚ns‘: nicht signifikant). Der 
COS Parameter misst das Nicht-Überlappen der Verteilungen (hier: 1, stark überlap- 
pend, bis 4, weitgehend getrennt). Insbesondere für die Lautdenkmal-Sprecher ist das 
Dehnungs-A signifikant von kurzem A unterschieden. Das gilt auch für das Frankfur- 
ter Lautdenkmal (FraLD), was im Kontrastpaar [Ar A] mit Al = 0,7** [0,7-0,7] 
eine deutliche Distanz zur Gruppe A der neutralen A aufrechterhält. Im Kontrast- 
paar [Ar »A] ist in FraLD mit AC = 0 aus AG = (0,04)"° [0,00-0,06] kein Abstand 
messbar und so ist von einem Zusammenfall bzw. Merger der Laute auszugehen. 
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Sprecher COS nı wı Gh m wm & KA a A 9% 
FraLD 07 7 8 AO 29 12 33 07 * 0707 x 


FraF2L 02 24 11 33 27 6 
FraF3L 02 26 12 39 27 7 
FraF4L 03 14 1 40 5 95 40 =. m - = 
FraFAIL 05 17 11 40 2 5 
FraFAL 04 12 8 AO 15 
B) 


FraFJ1 05 11 1 40 9 38 02 .ns - — 
FraLC 0,5 9 7 40 8 5 40 = ns — 
“KOZMR 083.24 17 20 10 DD AU m et 
K09MR 04 24 18 A0 10 10 40 _ ns — 
K10MR 02 22 16 38 10 10 AO 02 ns - — 
K61BE 13 11 40 19 12 40 = ns —- — 
K62BE 04 122 11 40 20 13 40 — ns — 
i A: 
FraLD 08 17 9 20 293 2 33 13 * 13 13 x 
KG1 1,0 6 6 20 7 330 10 * 10 10 x 
KG2 0,5 3 3 18 6 3.25 07 ns - = 


FraF2L 09 29 13 18 27 6 
FraF3L 09 21 2 20 27 7 
FraF4L 1:0 19: I, 2,0u..55, 55-40. 72,0. 98 2,0 = 
FraFAIL 05 17 2 20125 
FraFA2L 09 16 13 20 115 
5) 


Tabelle 43: Beurteilung der Dialektalität des Dehnungs-A anhand der Merk- 
malsdistanz AC® des kurzen A (A) und des Dehnungs-A (Ar). Ein für die Frank- 
furter Stadtmundart typisches, signifikantes und dialektales Muster bzw. eine binäre 
Dialektalität wird mit x markiert (Hauptbedingung AC > 0,5; Nebenbedingung 
(a < 3,5). d misst hier den Merkmalsunterschied in der Kontrastgruppe [A A: | bzw. 
[0x »Ar]. Signifikanzen «a: **: hoch signifikant; x: signifikant; ‚ls‘: zu geringe Proben- 
zahl; ‚th‘: Minimaldistanz nicht erreicht: ‚ns‘: nicht signifikant. COS: Bhattacharyya- 
Distanz als Maß für die Trennung der Verteilungen, — 1: getrennt; n: Probenzahl; 
w: Zahl der Stämme. Für Werte < 0,05 steht ‚—“. Insbesondere die Lautdenkmal- 
Sprecher haben einen signifikanten Unterschied im Kontrastpaar [A Az]. Die Tabel- 
le unten testet auf die erwartete Trennung in [Ar »0:] - Widersprüche hinsichtlich 
d zwischen beiden Tabellen sind mit ( ) bzw. (x) markiert. 
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9.6 Junges langes A 
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Übersicht: Die wichtigsten Lautentwicklungen für das junge lange A im Frank- 
furterischen, wie sie sich aus den Schriftbelegen ergeben (obere Zeile: erschlosse- 
ne IPA Lautwerte; untere Zeilen: originale Lautzeichen der Quellen; HD: Hoch- 
deutsch). Das junge lange A war immer gleich dem neutralen A des Hochdeut- 
schen. 


9.6.1 Klassisches Frankfurterisch 


Während, wie schon in den Abschnitten 9.4.1, S. 306 f., und 9.4.1.1, S.307£., be- 
schrieben, im Frankfurterischen langes A in der Regel dunkel war, ist dies im 
Hochdeutschen nicht der Fall. Folglich ist zu erwarten, dass Wörter mit langem 
A, die aus dem Hochdeutschen in das Frankfurterische übernommen wurden, mit 
langem neutralen A erscheinen. Das ist vornehmlich natürlich bei Wörtern der 
Fall, die relativ jung sind und deren Aussprache durch das Hochdeutsche genormt 
ist. Diese sollen hier als junge lange A bezeichnet werden. Als Beispiel mögen 
die faschistisch-politischen Begriffe aus Hauptperiode 5 (1925-1945) gelten, die im 
Frankfurter Lautdenkmal auftauchen, so z.B. nhd. Nazi, [na:tsi], kFra. [nattsi]. 

Ähnlich gingen schon in Oppels Zeiten manche Namen, wie z.B. nhd. Adolf, 
[a:dolf], kFra. [a:dalf] und bestimmte Signalwörter und Schimpfwörter, wie z.B. 
nhd. Arsch, [arf], mhd. ars, kFra. [a:f] (gegenüber dem Körperteil, kFra. [a:f], wo 
das A üblich dunkel gesprochen wurde): 


„Wird es aber als Schimpfwort [...| oder in Redensarten [...] gebraucht, so wird stets die Form 
mit offenerem reinen (a) gesprochen, um dem Schimpfwort den nötigen Nachdruck zu verlei- 
hen. Hierbei wird der Mund stärker geöffnet, wodurch reines (ä) erzeugt wird“ (RAU: 90.3, 
Anm. 5). 


9.6.2 Ausgewählte Schriftbelege 


1.A > [a] > hd.la:] \ 
» Adolf. > [a:]?: OPF?, 1.19.5: Adolf: Ausnahme zu &. — » Arsch. (ars). D 
[a:f]®*: OPF?, 1.19.1: Arsch: a. OPZ?, 1.21.7: Böwweläsch. Rau*, 90.3 Anm. 4: 
äslox, lek mis am äs (Arschloch; leck mich am Arsch). 
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9.6.3 Die Kontrastgruppe Ar-mod im VokalJäger 


Die in diesem Abschnitt untersuchte Gruppe der jungen ‚modernen‘ langen A wird 
mit der Gruppe des kurzen neutralen A, den Gruppen der kurzen und langen O- 
Laute und dem Dehnungs-A kontrastiert: 


Ar-mod Jüngere Wörter mit langem A, die der Hochsprache entnommen wur- 
den: Das klassische Frankfurterische hatte hier langes neutrales [ar], 
obwohl der Dialekt für das lange A sonst üblicherweise langes dunkles 
[a:] aufwies. 


Es wird erwartet, dass der Öffnungsgrad der Frankfurter A in dieser Gruppe voll- 
ständig mit dem hochdeutschen Wert C = 4 zusammenfällt. Entsprechend ist für 
das Kontrastpaar [A>Ar-mod| ein Ad = 0 prognostiziert, gänzlich gleich dem 
Hochdeutschen. Damit gehen diese jungen langen A fundamental anders als die 
langen Dehnungs-A und altlangen A, also die Kontrastgruppen A: und A, die bei- 
de dunkel sind. Für die langen älteren A stand dunkles [a:] mit € = 3. Folglich 
sollte im Frankfurterischen für das Kontrastpaar [Ar-mod Az] ein AC = 1 bzw. 
zumindest ein AC > 0 zu messen sein. 

Zur Dialektalitätsbeurteilung muss natürlich beachtet werden, dass — gleich 
welcher Herkunft - im klassischen Frankfurterisch immer dunkles A für langes A 
stand. Entsprechend gelte: Ein Sprecher bzw. eine Sprachprobe wird als Frankfur- 
terisch markiert, wenn vor allem in den Kontrastpaaren [A A:-mod]| ein signifi- 
kanter Abstand mit AC > 0,5 gemessen wird. Als hinreichende Nebenbedingung 
soll für die Kontrastgruppe Ar-mod ein ( < 3,5 gelten, also ein tendenziell dunkleres 
A. Für die Gruppe Ar-mod werden also dieselben Kriterien hinsichtlich Dialektali- 
tät angesetzt, wie für die Gruppen Ä und Az, obwohl eine Verletzung der Kriterien 
erwartet wird. 

Exemplarische Messwerte des VOKALJÄGERSs für die Merkmalswerte ( und die 
Merkmalsdifferenzen AG sind in Tabelle 44 auf S. 332 wiedergegeben. Die vollstän- 
digen Ergebnisse zu ( werden in Abbildung 102 auf S. 334 dokumentiert, wo auch 
die Schwankungsbreiten abgelesen werden können. Die Messungen zu AC finden 
sich in Abbildung 103 auf S. 335. Weitere Zahlenwerte und ein Test auf frankfurte- 
rische Dialektalität hinsichtlich des Kontrastpaars [A Ar-mod] sind in Tabelle 45 
auf S.333 gedruckt. Ergänzende Daten zu AC"P liefert Abbildung 147 auf S.481 
im Anhang. Einzelheiten zum Aufbau der Kontrastgruppen und den ( und (! sind 
ebenso im Anhang ab Abbildung 130, S. 466 f., beigelegt. 


9.6.4 Diskussion 


Die Ergebnisse bestätigen die Erwartung: Das junge lange A fällt im Frankfurter 
Lautdenkmal mit dem neutralen A im Lautwert [a] zusammen. Die Kontrastgruppe 
Ar-mod weist ein GC = 4,0 [4,0-4,0] auf, was völlig identisch dem der Gruppe A 
ist. Entsprechend ist auch AC = 0 aus Al’ = (0,0)"® [0,0-0,0] im Kontrastpaar 
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AG AG 

A Am A: A Am A: 
kFra [@ 4,0 3,0 3, FraLD ( 4,0 4,0 3, 
A a 4,0 a 4,0 
Ar-mod a: 3,0 1,0 Ar-mod 4,0 (—)"” 
A: a! 3,0 1,0 = A: 3,3 .07* 0,7 
Ä a: 3,0 1,0 = = Ä 33 07* 07”  (-)%8 
0 0 2,0 2,0 1,0 1,0 0 2,5 1,5 1,5%  0,9* 
0: [0) 2,0 1,0 2,0 1,0 0: 2,0 2,0% 2,0°* 1,3% 

AG NG 

A Am A: A Am A: 
HD & 4,0 4,0 3,0 K10 [@ 3,8 4,0 4,0 
A a 4,0 a 3,8 
Ar-mod ai 4,0 = Ar-mod 4,0 (0,2)" 
A: a: 4,0 - - Ar 4,0 (0,2) (—)B 
Ä a! 4,0 Ä 4.0,(0,:2)8. (2). (ee 
0 h) 30 10 10 10 0 3:0: “0,8°°. 1,0) 350° 
0: 0! 2,0 2,0 2,0 2,0 0: 20° 1,8 O0) 2,0 


Tabelle 44: Exemplarische Merkmalswerte ( und Merkmalsdifferenzen A( für das 
junge lange A (Gruppe Ar-mod, abgekürzt: Arm) im Kontrast. —kFra: ideelle Re- 
ferenzwerte eines Sprechers des klassischen Frankfurterischen aus Hauptperiode 4 
(1900-1925); HD: entsprechende Aussprache im Hochdeutschen. —Messungen mit 
dem VOKALJÄGER: FraLD: Das Frankfurter Lautdenkmal von 1937; K10(MR): 
Hochdeutsche Sprecherin. Angesetzt wurde das gleitende Merkmal der Öffnungs- 
stufe der Hinterzungenvokale. Das ( = 4,0 [4,0-4,0] liegt für FraLD voll auf dem 
Wert für das neutrale A und entsprechend ist auch im Kontrastpaar [AA:-mod] 
mit AC = 0 aus AC® = (0,0)" [0,0-0,0] kein Unterschied messbar: Das junge lange 
A - im Gegensatz zu dem alten Dehnungs-A: und dem altlangen Ä - nicht mehr ver- 
dunkelt (alle Werte in den Tabellen sind mit einer Stelle Genauigkeit wiedergegeben; 
nicht-signifikante originäre AC® sind jeweils in Klammern gesetzt und stehen für ein 
endgültiges AC = 0; das Signifikanzniveau ist hochgestellt; Werte mit AC’ < 0,05 
sind als ‚— gedruckt). 
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Sprechee COS nı w GG m wa Ca Al a Ac % 


FraLD 03 IT 8 20 7 5.40 Fr Page 
KG1 03 4 3 a0 2 8 40 ne 
KG2 03 A 3 a0 5 5 40 je ar 
BE a a ve a Pa 
FraFALL 05 m Ss 02 1 3838 092 kB - - 
"KUZMR 027 38 7,5001 1 ET aner 
KOMR 03 24 18 40 1 1 40 u Ha 
KOM 05 26 33 ı  ı a0 2 - - 


Tabelle 45: Beurteilung der Dialektalität des Jungen langen A-Lauts anhand der 
Merkmalsdistanz AC® des kurzen A (A) und des jungen langen A-Lauts (Ar-mod). 
Ein für die Frankfurter Stadtmundart typisches, signifikantes und dialektales Mus- 
ter bzw. eine binäre Dialektalität wird mit x markiert (Hauptbedingung Al > 0,5; 
Nebenbedingung (da < 3,5;). d misst hier den Merkmalsunterschied in der Kontrast- 
gruppe [AwA:-mod]. Signifikanzen a: x**: hoch signifikant; x: signifikant; ‚Is: zu 
geringe Probenzahl; ‚th‘: Minimaldistanz nicht erreicht: ‚ns‘: nicht signifikant. COS: 
Bhattacharyya-Distanz als Maß für die Trennung der Verteilungen, — 1: getrennt; 
n: Probenzahl; w: Zahl der Stämme. Für Werte < 0,05 steht ‚—“. Junges langes A 
unterscheidet sich nicht signifikant vom kurzen A-Laut und Dialektalität liegt nicht 
vor. 


[Aw Ar-mod]|. Somit hat Ar-mod einen fundamental verschiedenen Lautwert im 
Vergleich zu den langen alten A, dem Dehnungs-A und dem altlangen A. Das junge 
lange A trennt deutlich vom langen alten A, z.B. im Kontrastpaar [Ar-mod Ar] 
mit einem AG = 0,7* [0,7-0,7]. Dieses Muster wiederholt sich für das Klein-Gerauer 
Lautdenkmal und alle anderen Sprecher des Neu-Frankfurterischen, obwohl die 
Datenlage sehr dünn ist. Für KG1 misst man z.B. ein ( = 4,0 [4,0-4,0] und im 
Kontrastpaar [A>Ar-mod] ein Al = 0 aus Al? = (0,0)"5 [0,0-0,0]. 

Der Lautwert des jungen langen A im Frankfurter Lautdenkmal aus Hauptperi- 
ode 5 (1925-1945), im Klang dem Hochdeutschen [a:] gleich, nimmt den Untergang 
des anderen langen A-Lauts, des dunklen [a:] vorweg: wie schon in Abschnitt 9.4, 
S.306 f., für altlanges A und Abschnitt 9.5, S.319f., für das Dehnungs-A gemes- 
sen, haben die jüngeren Sprecher allesamt kein langes dunkles [a:] mehr in den 
Kontrastgruppen A bzw. Ar. Langes neutrales [a:] ist an seine Stelle getreten. Die- 
ser Prozess der Neutralisierung des langen [a:] hin zum langen neutralen [a:] des 
Hochdeutschen betraf in den Hauptperioden 4 und 5 wohl nur einige ausgewählte 
und vor allem moderne dialektfremde Begriffe. Für Rauh war [a:] für langes A 
völlig regelmäßig und eine entsprechende Aufhellung des [a] wird nur für das kurze 
A berichtet (vgl. Abschnitt 9.7 ab S.336). „So hell, wie die heutige Frankfurter 
Schuljugend das a etwa in nass, Katze oder Saft spricht, klingt es beim langen «a 
noch nicht“ (Freiling 1924, 192). 
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Öffnungsstufe junges langes A 
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Abbildung 102: Das junge lange A im VOKALJÄGER. Verteilung des gleitenden 
Merkmals der Öffnungsstufe der Hinterzungenvokale ( für verschiedene Sprecher. 
Anordnung in Gruppen von links nach rechts: LD: Lautdenkmal; HD: Hochdeutsch 
in Auswahl und Mittel; NF: Neu-Frankfurterisch, insbesondere REDE. Das Symbol 
und der unten gedruckte Wert zeigen den Median an, also (; der vertikale Strich den 
G-Interquartilbereich zwischen dem 25%- und 75%-Perzentil. Das obere Zahlenpaar 
protokolliert die Probenzahl n und Zahl der Stämme w, getrennt mit ‚/‘. Das ( des 
jungen langen A liegt immer im Bereich des kurzen A (C = 4). Auch das Frankfurter 
Lautdenkmal (FraLD) hat ein ( = 4,0 [4,0-4,0]. 
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Intra-Sprecher-Distanzen: Öffnungsstufe junges langes A 


co co 0c0 00... U[UV0O0000,5 0 2 2 2 2 0200 


H 
F 
F 
F 
F 
F 
F 
F 
H 
F 
F 
F 
F 


Abbildung 103: Merkmalsdistanz A( zwischen dem jungen langen A als Refe- 
renz und den A- und O-Lauten (A, Ar, O und Or) desselben Sprechers als Vergleich 
(Symbol: Merkmalswert ( der Referenz; vertikaler Strich und Zahl: originäre Diffe- 
renz A( bezüglich des gleitenden Merkmals der Öffnungsstufe der Hinterzungenvo- 
kale; das andere Ende des Strichs zeigt mit dem Symbol ‚-‘ das ( des Vergleichslauts 
an). Referenz- und Vergleichslaut gelten als unterschiedlich, falls die Distanz AC" 
signifikant ist (**: hoch signifikant; x: signifikant; ‚Is‘: zu geringe Probenzahl; ‚th‘: 
Minimaldistanz nicht erreicht: ‚ns‘: nicht signifikant). Der COS Parameter misst das 
Nicht-Überlappen der Verteilungen (hier: 1, stark überlappend, bis 4, weitgehend ge- 
trennt). Junges langes A unterscheidet sich nicht vom kurzen A (links oben); dement- 
sprechend für manche Dialektsprecher wohl aber vom Dehnungs-A (rechts oben). 
Für das Frankfurter Lautdenkmal (FraLD) liegt im Kontrastpaar [Ar-mod A] mit 
AC = 0 aus AC® = (0,0)"8 [0,0-0,0] kein messbarer Unterschied vor. Im Kontrastpaar 
[|Ar-mod Ar] zeigt sich mit einem signifikanten Unterschied von AG = 0,7* [0,7-0,7] 
ein deutlicher Abstand zum üblich dunklen Dehnungs-A. 
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0 1 2 3 4 B) 
1700 1825 1850 1875 1900 1925 
mhd. Hauptperiode 1825 1850 1875 1900 1925 1945 HD 
-HT, -HS Frankfurt h) h) a a a 
wienaht, COM Eu 
ahse (Rauh) h) a a 
-RT (kürzend) Frankfurt D8 2 da a a 
wie garten, . (Oppel) Be ä en ee ee 
karte (Rauh) h) ä-a a 
-RC Frankfurt h) h) a a a 
wie farwe, u (Oppel) Da ä ee 
starc (Rauh) h) a a 
-T (einzelne) Frankfurt S A) a a 
wie blat, ee ee 
sat (Rauh) 
Sonorsilben Frankfurt h) h) a a a! 
wie snabel, -. (Oppel) Ban ä a 
haben (Wülcker) a 
(Rauh) h) a a 
aber: hamer Frankfunt 000000000000 VE a a a, 
häst, hät, Frankfurt ) a/o  a/o 
gehät (Mundart) a 
(Oppel) a 
(Rauh) a/o  a/o 


Übersicht: Die wichtigsten Lautentwicklungen für das kurze dunkle A - ent- 
standen durch Kürzung aus Ar oder A- im Frankfurterischen, wie sie sich aus 
den Schriftbelegen ergeben (obere Zeile: erschlossene IPA Lautwerte; untere Zei- 
len: originale Lautzeichen der Quellen; HD: Hochdeutsch). Das kurze dunkle A, 
wie es noch als [a] in Periode 4 nachweisbar war, verlor spätestens in Periode 5 
seinen eigenständigen Charakter und verschmolz als [a] mit dem neutralen A. 
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9.7.1 Klassisches Frankfurterisch 


Dunkles A war im Frankfurterischen in der Regel lang (vgl. Abschnitt 9.4.1.1 ab 
S.307), aber es konnte auch kurz vorkommen. Der Fall des kurzen dunklen A ist 
besonders interessant, weil dieses [a] mit seinem []-ähnlichen Klang zu dem sonst 
kurzen neutralen [a] des Frankfurterischen in Opposition geht (vgl. Abschnitt 9.3.1 
ab S. 297). Kurzes dunkles A ging vor allem auf ehemalig langes und somit dunkles 
A zurück, welches verkürzt wurde. Das war ein in den Mundarten um Frankfurt 
übliches Muster: „Sofern |...] kurzes offenes 9 begegnet, handelt es sich um Rück- 
verkürzungen aus 9 für Dehnungs-a* (Wiesinger 1980, 85). Kurzes dunkles A fand 
sich im Frankfurterischen insbesondere vor bestimmten Konsonantengruppen, die 
verkürzend wirkten. Die Muster der Bewahrung der Kürze, Dehnung und Kürzung 
sind durchaus unterschiedlich zwischen dem Hochdeutschen und den Mundarten. 
So entstand ein Spannungsfeld, in dem sich das Frankfurterische im Lauf der Zeit 
in manchen Fällen der hochdeutschen Lautlänge angeglichen, in anderen aber die 
unterschiedliche Quantität bewahrt hat. Wesentlich ist, dass mit dem Übergang 
von langem dunklen A auf kurzes dunkles A auch bald der dunkle Lautklang des 
A verloren ging: der Lautwert des kurzen A war ja im Frankfurterischen haupt- 
sächlich neutrales [a]. Dieser Prozess setzte schon zu Oppels Zeit ein. Für Wülcker 
(1877, 19) war der kurze dunkle A-Laut „heute im langsamen schwinden begrif- 
fen“. Spätestens aber im Übergang von Hauptperiode 4 (1900-1925) zu Periode 5 
(1925-1945) wird der Wandel zur Regel: 


„Die jüngste Generation hingegen gebraucht |...], wo es [=mhd. A:] als Kürze erscheint, ebenso 
regelmäßig (a) [...]. In dieser Rückwandlug zu dem reinen (a)-Laut haben wir den Einfluß 
der Schriftsprache zu erblicken“ (RAU: 93). 


Nur Rauhs „mittlere[n] Generation“ verwandte noch das kurze dunkle A, die „jüngs- 
te“ sprach schon „reines“ kurzes A (RAU: 22). Der qualitative Lautwert des kurzen 
dunklen A war in Frankfurt vollkommen gleich dem des langen dunklen A aus Ä 
oder A: und die Lautbeschreibung aus Abschnitt 9.4.1, S. 306 £., gilt entsprechend. 
Rauh setzte für das kurze dunkle A in Periode 4 den Lautwert (a) an (RAu: 90.2). 
Auch gelten die von Rauh gemachten Beobachtungen zur Verdunklung bei der äl- 
teren Generation ebenso für das kurze dunkle A (vgl. Abschnitt 9.4.1.3 ab S. 309). 
Bei Wülcker (1877, 18 und 29) ist die Situation nicht ganz eindeutig, da er für 
das kurze dunkle A der Zeit das Zeichen (ä) verwendete und für das lange dunkle 
A das Zeichen (ao), was er „langes“ (ä) nannte, aber keinen expliziten Vergleich 
ausführte. Aber bei Oppel findet man wieder eine identische Beschreibung mit der 
Vokalnummer 11, nun ohne Längenbezeichnung, also (a). 

Aus diesen Informationen soll der Lautwert des kurzen dunklen A in Haupt- 
periode 4 mit [a] angesetzt werden. In Wülckers Zeit, also Hauptperiode 3 und 
davor, gelte [5], angelehnt an die beobachtete Lautbewegung des langen dunklen 
A-Lauts. Aber in Hauptperiode 5 hatte das Frankfurterische kurzes neutrales [a], 
ganz gleich dem Hochdeutschen. Für Sachsenhausen bzw. die Vororte wird ent- 
sprechend in Hauptperiode 4 das leicht dunklere [5] angesetzt. 
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Mit diesem starken Wandlungsverhalten ist das kurze dunkle A einer der inter- 
essantesten Laute des Frankfurterischen. In den folgenden Abschnitten werden die 
Hauptmuster, in denen das Frankfurterische kurzes dunkles A aufwies, vorgestellt. 
Die Frankfurter Lautbeispiele beziehen sich sämtlich auf Hauptperiode 4 (1900- 
1925), so nicht anders angegeben. Angemerkt sei, dass A vor historischem -LT in 
dem separaten Abschnitt 9.9 ab S.375 behandelt wird. Weitere Einzelfälle sind in 
den exemplarischen Belegen der nun folgenden Unterabschnitte aufgeführt. 


9.7.1.1 A vor den Konsonantengruppen [-xt] und [-ks] 


Die mhd. Konsonantengruppe -HT, die lautlich hochdeutschem und frankfurteri- 
schem [-xt] entspricht, hatte „ziemlich allgemein“ verkürzende Wirkung auf alt- 
lange A (Paul |2007, 83] und Schirmunski [1962, 191]). Entsprechend taucht im 
Frankfurterischen der dunkle A-Laut aus Ä auf, aber eben verkürzt, so in [odaxt]* 
für gedacht aus altem gedäht!*. 

Mhd. -HT erhielt im Hochdeutschen die Kürze eines altkurzen A. Auch im 
Frankfurterischen war das A an dieser Stelle über alle belegten Hauptperioden 
kurz. Vermutlich wurde aber der altkurze frankfurterische Vokal hier einst zu A: 
gedehnt und dann gekürzt. Analoge Verkürzung konnte auch beim altlangen Ä 
vorkommen. Dies würde das kurze dunkle A an dieser Stelle, wie z.B. in [naxt]? 
für Nacht aus naht, erklären - einst lag hier langes und damit dunkles Dehnungs- 
A vor, das verkürzt wurde, aber seinen dunklen Klang beibehielt. Sowohl das 
Zentralhessische des Taunus als auch das Südhessische über Darmstadt zeigten 
ebenfalls verdunkeltes A an dieser Stelle, aber auch mit langem Vokal, was die 
These bestätigt (Schnellbacher [1963, 389] und Born [1938, 52]). Ebenso dunkel 
war jüngeres A vor [-xt], etwa aus Lehnworten wie [Jaxtl]* für Schachtel. 

Das Frankfurterische löste den Verschluss -GT/-GET auf und es entstand Gut- 
turalspirans mit Dental [-xt], was in Analogiebildung ebenso Kürzung erzeugen 
konnte, so z.B. in [ksaxt]? für gesagt!”°. 

Vor der mhd. Konsonantengruppe -HS, mit hochdeutscher und frankfurterischer 
Lautentsprechung [-ks], stand ebenfalls kurzes dunkles A, so z.B. nhd. Wachs, 
mhd. wahs, kFra. [vaks]. Das Muster ist völlig analog dem vor -HT: ebenso war 
hier vermutlich einstmals ein langer Vokal, der sich noch in vereinzelten Bele- 
gen aus dem Taunus, nicht aber mehr im Südhessischen über Darmstadt, findet 
(Schnellbacher [1963, 389] und Born [1938, 52]). Manche Wörter scheinen sich zwi- 
schen Lautgruppen bewegt zu haben, so hat sich z.B. Axt, mhd. ackes, mit [aks]? 
— [aks]* der HS-Gruppe angeschlossen. 


122Hjer sei noch mal auf die Notation der Laute hingewiesen. Dem eigentlichen Lautwert wird, 
um Lautwandel anzeigen zu können, die Hauptperiodenziffer hochgestellt beigefügt. So markiert 
z.B. ein [a]*, dass der Lautwert [a] für die Hauptperiode 4 (1900-1925) gilt. Gerade in diesem 
Abschnitt ist es wichtig, sauber zwischen der Lautung in Hauptperiode 4 und der Lautung in 
Periode 5 (1925-1945) zu unterscheiden. 

123 Oft ist an dieser Stelle allerdings im Frankfurterischen ein Umlaut, z.B. nhd. er sagt, [se:/t], 
was möglicherweise auf alte mitteldeutsche E-Formen zurückgeht (Lex: 571). 
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Nicht in diese Gruppe fallen [-xt], die auf mhd. -CHT/-CHET zurückgehen. 
Diese sind im Frankfurterischen kurz und neutral, z.B. nhd. er lacht, mhd. er 
lachet, kFra. [laxt] (vgl. Abschnitt 9.3.1 ab S. 297). 

AI diese kurzen dunklen [a]? wandelten sich spätestens in Hauptperiode 5 
(1925-1945) zu kurzem neutralen [a]?, gänzlich gleich dem Hochdeutschen. Die 
angesetzte ursprüngliche Länge ist für diese kurzen A nirgends mehr nachweisbar. 


9.7.1.2 A vor historischem R und weiterem Konsonant 


Mhd. -RT dehnte altkurzes A oftmals im Hochdeutschen und in den Mundarten 
(Paul [2007, 82] und Schirmunski [1962, 189]). Im Frankfurterischen bietet sich ein 
buntes Bild: da gibt es Wörter, die sowohl im Hochdeutschen als auch im Frankfur- 
terischen einen langen Vokal haben. Entsprechend hatte das Frankfurterische hier 
dunkles Dehnungs-A, z.B. nhd. Fahrt, [faret], mhd. vart, kFra. [fart]!. Die Regeln, 
die diese langen A bestimmen, sind völlig gleich denen für die schon beschriebenen 
dunklen Dehnungs-A aus Abschnitt 9.4.1.1, S.307£. Für die Auswertungen mit 
dem VOKALJÄGER werden sie mit diesen Dehnungs-A zusammengefasst. 

Besonders interessant sind aber jene A vor altem -RT, die im Frankfurterischen 
einstmals lang waren und sich dann verkürzten - in Angleichung an das Hoch- 
deutsche. Dazu gehören z.B. nhd. Garten, |gartn], und nhd. Karte, [karte]. In 
beiden Fällen hörte Rauh in Hauptperiode 4 (1900-1925) schon kurzes dunkles A 
neben langem dunklen A. Aber in Hauptperiode 3 (1875-1900) war der Vokal noch 
durchgehend lang, insgesamt also z.B. [95:do]? — [Ya:rdo]* — [Yado]* und [k"o:t]? 
— [kart]? — [kat]. Die jüngste Generation, also Rauhs Apparent-Time-Haupt- 
periode 5, hatte dann schon durchgehend kurzes neutrales A: [gado]’ und [k"at]?. 
In diesen und weiteren Fällen hatte sich also eine vom Hochdeutschen abweichende 
Länge bis in Rauhs Zeiten bewahrt. In anderen Wörtern war die Kürzung hinge- 
gen schon zu Oppel Zeiten abgeschlossen. Allgemein gilt hier genauso, dass kurzes 
dunkles [a] bis Hauptperiode 4 vorhanden war und sich dann hin zu kurzem neu- 
tralen A wandelte; z.B. nhd. schwarz, [[varts], mhd. zwarz, kFra.[[vats]', dann 
[Jvats]?. 

Altkurzes A vor anderen R-plus-Konsonant-Verbindungen war ebenfalls dunkel 
und kurz und verlor den dunklen Klang in Hauptperiode 5: z.B. nhd. Farbe, [farbo], 
mhd. farwe, kFra. [fap]* und dann [fap]°. 


9.7.1.3 A vor historisch auslautendem T 


Manche altkurze A vor auslautendem historischem -T waren im Frankfurterischen 
wohl einstmals lang und verkürzten dann. Für vereinzelte Wörter ist dies noch für 
die erste Belegperiode 1, Oppels älterer Generation, nachweisbar, z.B. nhd. Blatt, 
[blat], mhd. blat, kFra. [plo:t]' und dann [plst]? — [plat]*. Meist war der Übergang 
zu Oppels Zeiten schon abgeschlossen, z.B. nhd. satt, [zat], mhd. sat, kFra. [sot]? 
und so für Rauh gar nicht mehr erkennbar: er hörte nur noch [plat]* und [sat]*. 
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Abermals bestätigen die Umgebungsdialekte die ursprüngliche Länge: der Vorder- 
taunus hatte in satt noch in den 1960ern [so:d] — der Hintertaunus wies mit [sorod] 
leichte zentralhessische Diphthongierung auf (Schnellbacher 1963, 390). 


9.7.1.4 A vor den historischen Sonorsilben -ER, -EL, -EM und -EN 


Die Silben -ER, -EL, -EM und -EN können im Frankfurterischen ursprüngliches 
altlanges A und Dehnungs-A verkürzen, z.B. nhd. Schnabel, [na:bl], mhd. snabel, 
kFra. [[navl]?, ein Vorgang, der für viele Mundarten typisch ist (Schirmunski 1962, 
192). Das Frankfurterische hatte hier entsprechend kurzes dunkles [a]*, das in 
Hauptperiode 5 zu kurzem neutralen [a]? wandelte, also [[navl]?. In diesem Beispiel 
kontrastiert kurzes Frankfurterisch mit langem hochdeutschen Vokal. Aber auch 
die umgekehrte Situation ist möglich. Wülcker hörte noch langen Vokal in z.B. 
nhd. Hammer, [hame], mhd. hamer, kFra. [haım&]?. Zu Rauhs Zeit war es dann 
schon [ham] und wandelte sich dann in [ham&]?. 


9.7.1.5 A in Flektionsformen von ‚haben ' 


Die Flektionsformen von haben basieren zum Teil auf altlangem A, erscheinen aber 
im Hochdeutschen und im Frankfurterischen der Hauptperiode 4 kurz, z.B. nhd. er 
hat, [hat], mhd. hät, kFra. [hat]* neben [hot]* mit kurzem geschlossenen [o], oder 
nhd. haben, [ha:bn], mhd. haben, kFra. [havo] mit Rückverkürzung eines ehemali- 
gen Dehnungs-A durch die Sonorsilbe -EN (vgl. vorheriger Abschnitt). Rauh hörte 
hier ein Nebeneinander von [a] und geschlossenem [o]. Dieses [o] kann ein be- 
wahrter Urzustand des altlangen A im Frankfurterischen sein, der hypothetisch 
mit geschlossenem [o:] angesetzt wird, gleich dem in den Reliktwörtern aus Ab- 
schnitt 9.4.1, S.306f. Das Gleiche gilt für z.B. nhd. du hast, [hast], mhd. häst, 
kFra. [hast/host]? und z.B. nhd. gehabt, [gohabt], mhd. gehät, kFra. [gohat/gohot]* 
Wülcker vermerkte nur (hot), also kurzes geschlossenes [o] für seine Hauptperiode 
3. Seltsamerweise findet sich für die A-Formen von haben bei Oppel kein einziger 
Beleg für den geschlossenen O-Laut, [o] bzw. (0) - er schreibt durchweg in allen 
Faszikeln immer und immer nur (ä) oder (0), was ja hier mit offenem [5] angesetzt 
wird. Die älteste Frankfurter Mundartdichtung, Textor 1794, schwankt zwischen 
den Schreibungen (o) und (a)'?*. So mag eine alternative Erklärung für das Frank- 
furter [o] die eines später entstandenen Kunstlauts sein, gleich ob dieser original 
ebenso vorlag: Manche Dialektsprecher wollten besonders dialektal sprechen bzw. 
sollten so klingen und übernahmen den deutlich dunkleren Laut der Vororte. Op- 
pel vertrauend soll für das A in den haben-Flektionen ein kurzes dunkles [>]? für 
Hauptperiode 2 angesetzt werden und ein Nebeneinander von [5/0] bzw. [a/o]* 
ab Wülckers Zeit vermutet werden. Für alle verkürzten haben-Flektionen gilt vor 


12471 den vermeintlich älteren Frankfurter Gedichten vgl. Fußnote 85 auf S. 241 - sie sind 
nachweislich von ihrem Lautstand her nicht Frankfurterisch. 
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allem der Übergang des kurzen dunklen [a]* zu neutralem [a]? in Hauptperiode 5. 
Das deutlichere [o]’ konnte sich allerdings länger behaupten. 


9.7.2 Ausgewählte Schriftbelege 


1. A vor den historischen Endsilben -HT, -HS und ähnlichen: 


(aJAÄ-HT > P]°- [a [a > ha.f[a] 
» gebracht. (gepräht). > [gopraxt]*: Rau‘, 109.1: gepraxt. > [gopraxt]’: 
RAU?, 110: a. © Seckbach, Preungesheim, Berkersheim: D [or]: Raut, 7: 
gopröxt. — » gedacht. (gedäht). > [Yodoxt]”: OPF?, 1.19.7: ich dacht: a. 
> [Qodaxt]*: Rau*, 109.1: gedaxt. > [Godaxt]’: RAU, 110: a. © Sach- 
senhausen: D [Qodo:xt]?: Rau?, 111: godöxt, „Von alten Sachsenhäusern 
habe ich geschlossenes o gehört “. 


(b)A-HT > PB] - [a - [a > ha.lal 
» acht. (ahte). > [»xt]?®: OPF?, 1.19.7: acht: ä. RAU?, 93: 5. > [axt]*: 
Rau“, 90.2.b: axt. & [axt]’: RAU, 93: a. — » betrachten. (betrahten). 
> [botraxto]?: Rau?, 93: 5. > [bstraxda]*: Rau*, 90.2.b: botraxdo. > 
[botraxdo]’: RAuU?, 93: a. — » gemacht. (gemaht). > [gomaxt]”*: OPF?, 
1.19.7: gemächt. RAuU?, 93: 5. > [gemaxt]*: Rau“, 90.2.b: gomaxt. > 
[gomaxt]: RaAu?, 93: a. BRO®, SpA, 32, 33: gamaxt. — » Nacht. (naht). 
> [na:xt]%®: OPF?, 119.7: Nacht: &. OPZ?, 1.22.6: Nächt. RAu?, 93: 5. > 
[naxt]*: Rau‘, 90.2.b: naxt. > [naxt]’: RAu?, 93: a. © Seckbach, Preun- 
gesheim, Berkersheim: D [noxt]!: Rau“, 7: ngxt. — » Macht. (maht). 
[maxt]?: OPF?, 1.19.7: Macht: a. — » Pracht. (praht). > [proxt]”: OPF?, 
1.19.7: Pracht: &. — » schlachten. (slahten). > [fl»xto]?: OPF”, 1.19.7: 
Schlacht, schlachte: ä. > [a]°: BRO®, SpA, 32: goflaxt. — » Tracht. (traht). 
> [traxt]?: OPF?, 1.19.7: Tracht: ä&. RAU?, 93: 5. > [traxt]*: RAu*, 90.2.b: 
traxt. D |[traxt]’: Rau?, 93: a. — » Wacht. (waht). > [voxt]”: OPF?, 
1.19.7: Wacht: ä. Rau?, 93: 5. > [vaxt]*: Rau“, 90.2.b: waxt. D [vaxt]°: 
RAU’, 93: a. 
(c) A-GET > [5]? + [al + [a > hd.[ar] 
» gesagt. (gesaget). > [»]?: [ksaxt]*/ [ksaxt]: vgl. sagen, S. 322. — » Jagd. 
(jaget). > [jaxt]*: vgl. jagen, S. 322. 
(d)A-CHT > []° > hd.[a] 
» Schachtel. (schachtel). Vermutlich italienisches Lehnwort aus dem 15. 
Jahrhundert. > [faxdl]?: OP?: Schächdel. 
(e) .A-HS > [+ [al + [a? > had.[al 
» Achsel. (ahsel). > [>ksl]”*: OPF?, 1.19.4: Acksel: &. RAU?, 93: >. 
> [aksl]*: Rau, 90.2.b: aksl. > [aksl]’: Rau?, 93: a. — » Dachs. 
(dahs). > [doks]”: OPF®, 1.19.4: Däckes. > [daks]’: OPF®, 1.19.4: 
„in neuster Zeit bei vielen a“. — » Flachs. (vlahs). > [floks]’: OPF?, 


V 
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1.19.7: ä& — » Wachs. (wahs). > [voks]”*: OPF?, 1.19.4: Wachs: &. 
RAU?, 93: 5. D [vaks]*: RAU“, 90.2.b: waks. > [vaks]’: RAU?, 93: a. 
— » wachsen. (wahsen). > [vokso]”*: OP?: war noch derzu im wächse. 
RAU?, 93: 5. > [vakso]*: RaAut, 90.2.b: wakso. > [vakso]’: R.AU?, 
93: a. © Oberrad: D [a]**: FR25%, WS16: waochse. © Seckbach, 
Preungesheim, Berkersheim: D [vokso]!: Raut, 7: wokse. 
i.a-BSs > [al > [al [a > ha.[a] 

» Achse. (ahse). > [aks]”: OPF?, 1.19.4: Ax: & > [oks]?: Rau?, 
93: 9. > [aks]*: Rau“, 90.2.b: aks. > [aks]?: Rau, 94: aks, „die 
Jungen“. © Sachsenhausen: D [aks]*: RAU?, 94: oks. — » Axt. (ackes). 
> [aks]”: OPF?, 1.19.4::&. > [aks]*: RAu?, 90.1, Anm. 1: aks, „zeigt 
Verdunklung in Anlehnung an |...] Wachs“. 


2. A vor historischem -R und noch einem Konsonanten: 


(a) A-RT > PP” - [a + [a > ha.[al 
> hart. (hart). > [hst]”: OPF?, 1.19.1: hart: &. OPZ?, 1.36.4: stähärt (stein- 
hart). > [hat]*: R.au?, 90.2.c: hat. — » schwarz. (zwarz). > [[vots]?: 
OPF?, 1.19.1: schwarz: &. > [fvats]*: RAu*, 90.2.c, 94: 5wats. > [[vats]°: 
RAUH?, 94: Swats, „die jungen“. © Sachsenhausen: D [[v»ets]*: Rau*, 
94: 5wol®ts. © Oberrad: D [5]**: FR25°: schwoaz. FR25*: schwoz. 


(b) A-RT > [5]? + [a]? > (al! + [a > ha.[al 

» Garten. (garten). > [9s:do]”: OPZ?, 1.30.4: Gärte, „vornehm Frankfur- 
terisch “. OPF?, 1.574: Gärte. As?, StL 1891: Gaarte. WS?, 33: Goorde. > 
[ga:do]*: Rau*, 94: gädo. > [Yado]*: RAu*, 90.3 Anm. 5: gado, „un- 
ter Einfluß der Schriftsprache“. > [Qado]’: RAU?, 94: gado, „die jungen “. 
& Umlaut: Gärtner: » [Gaeredn&]?: OPZ?, 1.50.1: Gärtner. RAU, 98.3: 
galfldnÄ. » [geeedn&]’: Raut, 211.a: getdnÄ, „unter schriftsprachlichem 
Einfluß die Verkürzung“. © Sachsenhausen: D [Yoredo]!: WS?, 4: Gaarte. 
Raut, 94: g5'®do. © Bornheim: D [ar]*: WS?, 33: Gaarte. © Eckenheim: 
> [aı]?: WS®: Goarte. © Oberrad: > [ar]**: FR25°: Gaoerde. WS?, 33: 
Garte. FR25*: Gaaode. — » Karte. (karte). > [k"oıt]: OPF?, 1.19.1: 
Kart: ä&. OPZ?, II.21.14: die Khärt. As?, FSt: Kaartespiel. > [kPa:t]®: 
RAU“, 91.3: khät. > [kPat]!: Raut, 91.3 Anm. 5: khat, „unter Einfluß 
der Schriftsprache “. > [k"at]’: R.AU?, 93: a, „jüngste Generation“. & Um- 
laut: Kärtchen: [er]: OPZ?, 11.21.14: Khärtche. — » warten. (warten). 
> [vordo]?: OP?: wärte. > [vardo]*: RAU“, 90.3: wäde. > [vada]*: Raut, 
90.3 Anm. 5: wado, „unter Einfluß der Schriftsprache“. > [vado]’: RAu?, 
90.3 Anm. 5: wado, „jüngste Generation“. — » zart. (zart). D [tsaıt]?: 
OPF?, 1.19.1: zart: ä&. D [tsat]?: RAuH*, 211.2.a: tsat. 


()A-RT > [3] + [a] > hd.f[a:] 
» Bart. (bart). & [bot]: OPF?, 1.19.1: Bart: &. > [bart]*: Rau“, 90.3: 
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bat. & Umlaut: Bärtchen: © [&:]?: OPZ?, 11.21.14: Bärtche (Dim.). — 
» Fahrt. (vart). vgl. fahren, S. 322. > [fort]?: [kart]. 
(d) A-RC > [5]? + [al - [a > ha.[a] 

» arg. (arc). > [[]?: OPF?, 1.19.1: arg: &. > [af]*: Rau“, 211.2.b: as. 
© Oberrad: > [p]®*: FR25°: aoech. FR25%: aosch. — » Farbe. (farwe). 
> [fop]”?: OPF?, 1.19.1: Farb: &. OPF?, 1.520: Dreckfarb. Rau?, 93: 5. D 
[fap]*: RAu?, 90.2.c: fap. RAU?, 121.1: Fam (Farben, PL). » Kap]: RAU, 
93: a. © Unlaut färben: Hr: evol: RAu*, 121.1: ferlwao. — > scharf. 
(scharf). & [Jsf]?: OPF?, 1.19.1: scharf: ä. > [faf]*: Raut, 90.2.c: Saf. 
— » stark. (starc). D& [jtok]®*: OPF?, 1.19.1: stark: ä. RAU?, 93: 5. D 
[Stak]*: Rau?, 90.2.c: Stak. > [ftak]’: RAu?, 93: a. 


3. A vor historisch abschließendem -T: 

AT > [a]! + pl? + [a > ha.[a] 

» Blatt. (blat). > [plo:t]': OPZ'”, TL1.1: „während Blatt immer 11 hat, al- 
tertümlich mit langem, modern mit kurzem Vokal“. OPF?, 1.19.5: Blatt: a, 
„besser ä“. D [plst]?: OPF?, 1.221: Stichblätt. > [plat]*: Rau, 90.1: plat. 
& Umlaut: Blätter (bleter): » [e:]?: OPF?, 1.594: Bletter. OPZ?, 11.21.9: „Wäh- 
rend es bei den alten Leuten noch heißt = .| das Blad, die Bletter, bei denen 
die jüngere Generation die Schärfung auch bereits im Sing. hat“ —» glatt. 
(glat). > [klot/klat]”: OPF?, 1.19.5: glat, „ä, seltener ä*. > [klat]*: Rau‘, 
90.1: klat. — » platt. (plat). > [plot/plat]”: OPZ?, IL1.1: „schwankende Aus- 
sprache [...] doch scheint |...] das a vorzugehen “. OPF?, 1.200: Plättköp. OPF°, 
1.200: die Plat gebutzt. OPZ?, 1.19.5: Plat, „selten a“. OPZ?, 1.7.11: „Das Ad). 
platt und das Subst. die Platt scheinen im ächten F. durchweg nur ä gehabt zu 
haben: die hin und wieder gehörte Aussprache ä scheint aus späterem |...] ent- 
standen zu sein“. > [plat]*: Rau, 210.b: plat. Rau‘, 205: plado (Platten). 
— » satt. (sat). D& [sst]?: OP?: sät. > [sat]*: RAU, 90.1: sat. — » Stadt. 
(stat). & [*o]': WÜM!, 29 (1457): von der stot. > |[dst]?: OPF?, 1.19.5: Stadt: 
ä. OPF?, 1.353: Städtämt. > [Sdat]*: Rau‘, 210.b: sdat. BRO’, SpB, 36: ftat. 
— » statt. (stat). > [5]: OPF?, 1.19.5: statt: ä. 


4. A vor historischen Sonorsilben: 


(a) A-BEL > [5° + [a + [a > ha.f[ar] 
» Gabel. (gabel). > |g»vl]?: OPF?, 1.19.3: Gawwel: ä& OPZ?, 1.23.10: 
Haigäwwel. RAuU?, 93: 5. > [gavl]*: Rau?, 90.2.d: gawl. > [davl]’: Rau?, 
93: a. — » Kabel. (kabel). > [5]: WÜF?, 29: käwel. — » Schnabel. 
(snabel). & [[n»vl]®?: OPF?, 1.19.3: Schnawwel: ä. RAU, 93: 5. WÜF?, 29: 
schnäwel. > [fnavl]*: Rau‘, 90.2.d: 5nawl. > [fnavl]’: Rau, 93: a. © 
Umlaut: Schnäbel: » [nevl]?: Rau, 213.11: Snewl. 

(b) A-MEL > [51]? + [al + [a > hd.[a] 
» Hammel. (hamel). > [harml]?: OP?: Hämel. WÜF°, 29: haomel. & 
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Umlaut: Hämmelchen, Dim.: » [er]: OPF?, 1.351: Hemelche. © Bornheim: 
> [horml]®: RauZz?, H: homl, „heute noch“. 


(c) A-DEN > [5]? < [a]* < [a > hd.[ar] 
» Faden. (vadem, vaden). > [fodm]?: OPZ?, 1.22.16: Fäddem. WÜF?, 29: 
fätem. D [fadm]*: Rau?, 174.1: fadm. & Umlaut: Fäden: » [fedm]: As, 
StL 1874: Fäddemche (Fädchen, Dim.). RAu*, 98.1: fedm. — » schaden. 
(schaden). > |]: WÜF?, 29: schät (der Schaden). > [fado]*: Rau“, 
90.2.d: Sado. 


(d) A-BER > [5° + [al > hd.[ar] 
» aber. (aber). > [»v&]”*: OPF?, 1.19.3: awerwitz. WÜF®, 29: äwer. — 
» Hafer. (habere). > [hav&]?: OP?: Häwwersack. > [hav&]*: Rau“, 
90.2: hawä. 


(e) A-IER > [5° + [a]? > hd.lar] 
» Adler. (adelar). > [»dl&]**: OPF?, 1.19.15: Addler: a. WÜF?, 29: ätler. 
> [a:rdl&]*: Raut, 208: adla. 


(f) A-MER > [3]? + [a]! + [a > ha.[a] 
» Hammer. (hamer). > [haım&]?®: OPZ?, 1.24.5: „Konstant Hämer |...]. 
Niemals Hamer“. OPF?, 1.19.8: Hamer. WÜF®, 29: haomer. RAU?, 204.2.b 
Anm.: hömdä, „nur noch der ältesten Generation geläufig“. > [ham&]*: 
RAU“, 90.2.a: hamä. > [ham&]’: RaAu?, 93: a. & Umlaut: Hämmer: 
[herm&]?: OPZ?, 1.23.10: Hemer. © Sachsenhausen: D [51]?: OPZ?, 1.24.5: 
Hämer. 


(8) A-TER > []° + [al + [a > ha.f[ar] 
» Vater. (vater). D |fod&]?: WÜF®, 29: väter. RAU?, 93: 5. > [fad&]*: 
RAu?, 90.2.d: fadä. > [fad&]’: Rau“, 93: a. 


5. A in haben-Flektionen: 


(a)Ä > [5° + P/o]? — [a/o]* — [a/o]® > hd.[a] 

» hast. (häst). > [hast/host]*: MAB°, 13: du host. RAu?, 109.4: host, 
hast, „schwankend“. Rau‘, 219.d: do hast (du hast). © Oberrad: D 
[0]®*: FR25°%%: du host. — » hat. (hät). > [hat]: MAB®°, 11, 12: hot, 
hat. TE°, FWB: hot, hotte. OPF’?, 1.5.70: höt. > [hat/hot]®*: WÜF®, 
18: hot. Rau“, 109.4: hot, hat, „schwankend: “. > [hat]®": Bro, SpA, 
33: had. BRO’, SpC, 35: hat. & Umlaut: hätte: © [het]: OPF?, 1.317: 
hätt er. © Oberrad: D [hot]?: FR25°: sie hot. > [o]*: FR25°: sie haod. 
© Berkersheim, Preungesheim: > [hot]: Rau“, 7.1: hot. © Seckbach: 
> [hot]: OP?: hot. RAuf, 7.1: hot. — » gehabt. (gehät). > [Yohat]”: 
Te’, FWB: gehat, gehott. OPF?, 1.222: gehät. OPF?, 1.381: die hätten. 
> [gahabt/gahat/gahot]*: Rau?, 109.4: schwankend: gohot, gohat, 
gohabt. 
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(b)Ar > PD]? - [a + [a > ha.lal 

» habe. (hab). > [h>p]?: TE, FWB: hob, habb. OPF?, 1.19.3: ich hab 
(ä). OPF?, 1.5 Pkt. 30: ich hob. > [hap]‘: RAU: hap, „gebildet in Analo- 
gie“. © Oberrad: > [hun]?: FR25°: ich hun. > [hop]: FR25*: ich haob. 
— » haben. (haben). >» [havo]?®: TE?, FWB: hawen, howe, habben. 
OPF?, 1.19.3: hawwe: ä&. OPF?, 1.395: hämmer (haben wir). WÜF?, 29: 
häwe. RAU?, 93: 5. D [havo]*: RaAu*, 90.2.d: hawo. RAu*, 219.c: hawoso 
(haben Sie?). > [havo]’: RAU?, 93: a. BRO’, SpC, 36: haba. © Oberrad: 
> [hur]?: FR25°: ern huu. > [hovo]*: FR25%: ern haowwe. — » habt. 
(habt). > [5]: OPF?, 1.19.3: ihr habt: ä. OPF?, 1.223: Ihr häbt. 


6. Andere Wörter mit kurzem dunklen A: 


(JA > [5]? + P/o]? — [a/o]* — [a/o’ > hd.[al 
» lassen. (lägen). > [1520]: MAB, 11, 13: loß, losse. OPF?, 1.220: lässe. 
OPF?, 1.317: lasse. OPF?, 1.224: 1äß (Imperativ). > [laza/loza]*: WÜF®, 
18: losse. RAU“, 109.4: loso, laso, „schwankend“. & Umlaut: lässt: » [lest]: 
OPZ2, 1.46.16: lösst. 


b)A > PP” [al > had.[al 
> was. (waz). > [vas]?: OPF?, 1.19.10: was: ä&. > [vas]*: Rau*, 92: vas. 


9.7.3 Die Kontrastgruppe kdA im VokalJäger 


Die in diesem Abschnitt untersuchte Kontrastgruppe der kurzen dunklen A wird 
mit der Gruppe des kurzen neutralen A, den Gruppen der kurzen und langen 
O-Laute und dem Dehnungs-A kontrastiert: 


kdA Wörter mit kurzem dunklen A, das in der Regel aus gekürztem langem 
dunklem A entstanden ist: Das klassische Frankfurterische hatte hier 
kurzes dunkles [a]‘, das Hochdeutsche hat kurzes neutrales [a]. 


Das Verhalten der Kontrastgruppe kdA (abgekürzter Code für: kurze dunkle A) 
ist eines der interessantesten Muster, da hier ein Lautwandel unter Beobachtung 
stattfand: etwa im Übergang von Hauptperiode 4 (1900-1925) auf 5 (1925-1945), 
wobei letztere Rauhs jüngere Generation aus der Sicht seiner Dissertation von 
1921 ist, verschwand das kurze dunkle [a]? und ging, dem Hochdeutschen gleich, 
in kurzes neutrales [a]? über. Aus der Sicht des VOKALJÄGERS ist das ein Wechsel 
von C = 3 zu( = 4 auf dem Merkmal der Öffnungsstufe der Hinterzungenvo- 
kale. Ursprünglich sollte somit im Kontrastpaar [kdA»wA]| ein Ad = 1 bzw. in 
[kdArAr| ein Ad = 0 zu finden sein, das sich zu einem AC = 0 in [kdA A] bzw. 
AC*1in [|kdAwAz | wandelte: während kdA den Laut [a] annahm, blieb ja in der 
Kontrastgruppe Ar das lange dunkle [a:] erhalten. 

Ein Sprecher bzw. eine Sprachprobe wird als Frankfurterisch markiert, wenn 
vor allem in den Kontrastpaaren [|kdA A] ein signifikanter Abstand mit AC > 0,5 
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AG AG 

A kdA A: A kdA A: 
kFra & 40 30 30 FraLD C 40 40 3,3 
A a 4,0 A 4,0 
kaA a 30 10 kdA 4,0 (—)" 
A: a 30. -10 - A: Be OR 
A a 30 10 - - Ä 3,3: Ort Dr 
0-rC M) 3,0 1,0 - u 0-rC 3.5: (0,5)8 (0,5) (0,1)! 
0 o 20.20 10 10 0 25. 57 10 0 
0: 0: 20 20 10 10 0: 2:0. 2:0 20° 13° 

AG AG 

A kdA A: A kdA A: 
HD C 40 40 40 FraLC C 40 40 3,3 
A a 4,0 a 4,0 
kaA a 4,0 - kaA 4,0 (—)" 
A: a 4,0 = — Ar 40° (-)® (-)" 
Ä a: 4,0 Ä 3:8: (0,2)7 (0,2) 10,2) 
0-r6 e) 3 10° Le. 0 O-rt 34 06* °0,6* (0,6)® 
0 b) 30. 10 10. 10 0 3:9: . SE. Le I1r 
0: 0: 0» 20° 20. 20 0: 20.209 2,0. 2,0% 


Tabelle 46: Exemplarische Merkmalswerte ( und Merkmalsdifferenzen Al für das 
kurze dunkle A (Gruppe kdA) im Kontrast. — kFra: ideelle Referenzwerte eines Spre- 
chers des klassischen Frankfurterischen aus Hauptperiode 4 (1900-1925); HD: ent- 
sprechende Aussprache im Hochdeutschen. —Messungen mit dem VOKALJÄGER: 
FraLD: Das Frankfurter Lautdenkmal von 1937; FraLC: Sprecherin des Neu-Frank- 
furterischen, hier mit nahezu hochdeutschem Lautmuster. Angesetzt wurde das glei- 
tende Merkmal der Öffnungsstufe der Hinterzungenvokale. Bei FraLD misst man ein 
C = 4,0 [3,7-4,0], was voll im Bereich des neutralen A liegt. Folglich ergibt sich auch 
im Kontrastpaar [AkdA] mit Al = 0 aus Al" = (0,0)" [0,0-0,3] kein signifikan- 
ter Unterschied: Die Verdunklung des kurzen, hier ehemalig dunklen, A ist nicht 
mehr nachweisbar (alle Werte in den Tabellen sind mit einer Stelle Genauigkeit wie- 
dergegeben; nicht-signifikante originäre AC® sind jeweils in Klammern gesetzt und 
stehen für ein endgültiges Al = 0; das Signifikanzniveau ist hochgestellt; Werte mit 
AC® < 0,05 sind als ‚—‘ gedruckt). 
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gemessen wird. Als hinreichende Nebenbedingung soll für die Kontrastgruppe kdA 
ein GC < 3,5 gelten, also ein tendenziell dunkleres A. 

Exemplarische Messwerte des VOKALJÄGERSs für die Merkmalswerte G und die 
Merkmalsdifferenzen AG sind in Tabelle 46 auf S. 346 wiedergegeben. Die vollstän- 
digen Ergebnisse zu ( werden in Abbildung 104 auf S. 348 dokumentiert, wo auch 
die Schwankungsbreiten abgelesen werden können. Die Messungen zu AC finden 
sich in Abbildung 105 auf S. 349. Weitere Zahlenwerte und ein Test auf frankfurte- 
rische Dialektalität hinsichtlich der Kontrastpaare [kdA A| und [kdA Ar ] sind 
in Tabelle 47 auf $.350 gedruckt. Ergänzende Daten zu AC"® liefert Abbildung 
148 auf S. 482 im Anhang. Einzelheiten zum Aufbau der Kontrastgruppen und den 
C° und (C! sind ebenso im Anhang ab Abbildung 131, S. 467f., beigelegt. 


9.7.4 Diskussion 


Im Frankfurter Lautdenkmal von 1937, das ist Hauptperiode 5, sind die Kon- 
trastgruppen kdA und A im neutralen Laut [a] zusammengefallen: Für kdA misst 
man ein Cd = 4,0 [3,7-4,0], was derselbe Mittelpunktswert wie in Gruppe A ist 
( = 4,0 [4,0-4,0]). Entsprechend ist auch kein Unterschied in der Merkmalsdiffe- 
renz zu messen, das Kontrastpaar [AkdA]| weist ein Al = 0 aus Al’ = (0,0)"° 
[0,0-0,3] auf. Das alte kurze dunkle [a] der Hauptperiode 4 ist verschwunden. Das 
Frankfurter Lautdenkmal geht dem Hochdeutschen gleich und hat nunmehr kurzes 
neutrales [a], genauso wie Rauh es für seine jüngere Generation und damit Haupt- 
periode 5 beschrieben hat. Damit verhält sich das Frankfurter Lautdenkmal für 
die Kontrastgruppe kdA genauso wie die hochdeutschen Sprecher und die meisten 
Neu-Frankfurter Sprecher. Für den hochdeutschen Sprecher K07MR misst man 
z.B. ein C = 4,0 [4,0-4,0] und einen Abstand von Ad = 0 aus AC® = (0,0)"° [0,0- 
0,0] zur A-Gruppe. Für den REDE-Sprecher FraF3L bestimmt man mit ( = 3,7 
[3,4-4,0] zwar eine Abweichung vom hochdeutschen Wert ( = 4, aber ebenso mit 
AC = 0 aus Al? = (0,2)"* [0,2-0,5] keinen signifikanten Unterschied zum kurzen 
A. Auch bei Broxten (1985) findet sich für das Frankfurterisch der 1980er keine 
Spur des kurzen dunklen A-Lauts mehr — auch nicht bei ihren älteren Sprechern. 

Das ist aber im Klein-Gerauer Lautdenkmal nicht der Fall, wo KG1 ein ( = 
3,0 [2,3-3,9] und KG2 ein ( = 1,9 [1,5-2,6] aufweist. Bei diesen Sprechern steht 
noch ein verdunkelter Laut, hauptsächlich in den kurzen haben-Varianten, die hier 
Lautwerte bis hin zu [o] bzw. C' & 2 annehmen (vgl. Abbildung 131 auf $. 467). 
Auch FraFAlL weist einen dunklen Laut mit ( = 3,0 [3,0-3,5] auf. Für KG1, KG2 
und FraFAIL wird entsprechend auch im Kontrastpaar [|kdA A] ein signifikanter 
Unterschied gemessen. Die Messergebnisse sind: AC = 1,0** [1,0-1,7], Ad = 2,1** 
[2,1-2,5] und Ac = 1,0* [1,0-1,0]. 
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Öffnungsstufe kurzes dunkles A 
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Abbildung 104: kurzes dunkles A (kdA) im VOKALJÄGER. Verteilung des glei- 
tenden Merkmals der Öffnungsstufe der Hinterzungenvokale ( für verschiedene Spre- 
cher. Anordnung in Gruppen von links nach rechts: LD: Lautdenkmal; HD: Hoch- 
deutsch in Auswahl und Mittel; NF: Neu-Frankfurterisch, insbesondere REDE. Das 
Symbol und der unten gedruckte Wert zeigen den Median an, also (; der vertikale 
Strich den (C-Interquartilbereich zwischen dem 25%- und 75%-Perzentil. Das obere 
Zahlenpaar protokolliert die Probenzahl n und Zahl der Stämme w, getrennt mit ‚/“. 
Während das kurze dunkle A im Frankfurter Lautdenkmal (FraLD) verschwunden 
ist — es liegt mit einem ( = 4,0 [3,7-4,0] auf der Stufe des neutralen A - kann man 
es z.B. in KG1 mit ( = 3,0 [2,3-3,9] noch deutlich beobachten. 
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Intra-Sprecher-Distanzen: Öffnungsstufe kurzes dunkles A 
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Abbildung 105: Merkmalsdistanz AC zwischen dem kurzen dunklen A (kdA) als 
Referenz und den A- und O-Lauten (A, Ar, O und Or) desselben Sprechers als Ver- 
gleich (Symbol: Merkmalswert d der Referenz; vertikaler Strich und Zahl: originäre 
Differenz AC® bezüglich des gleitenden Merkmals der Öffnungsstufe der Hinterzun- 
genvokale; das andere Ende des Strichs zeigt mit dem Symbol ‚— das ( des Vergleichs- 
lauts an). Referenz- und Vergleichslaut gelten als unterschiedlich, falls die Distanz 
AC° signifikant ist (**: hoch signifikant; *: signifikant; ‚Is‘: zu geringe Probenzahl; 
‚th‘: Minimaldistanz nicht erreicht: ‚ns‘: nicht signifikant). Der COS Parameter misst 
das Nicht-Überlappen der Verteilungen (hier: 1, stark überlappend, bis 4, weitgehend 
getrennt). Im Frankfurter Lautdenkmal (FraLD) liegt im Kontrastpaar [kdA»A] ein 
völliger Zusammenfall des kurzen dunklen A mit dem neutralen A-Laut vor, man 
misst ein Al = 0 aus Al? = (0,0)"® [0,0-0,3]. Anders hingegen in KG1: hier ist in 
demselben Kontrastpaar ein deutlicher Abstand AG = 1,0** [1,0-1,7] zu beobachten. 
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kdA A 
Sprehee COS nı u Gh m wm & A a MK 9% 
FraLD 08. 207211 20 7177 8.20 2m 2 = 
KG1 07 27 10 30 24 13 40 10 ** 10 10 x 
KG2 10.8.3 19.8, 3 20: 20 #91 81 % 


Far 038 9 5 34 a a 33 he - 
Kakst- 8% 51 - 15).,37.%.2,.3% 902 28: = 2 
FrakAL, 03 2 1 AO MU A = m ee 
FraFAIL 04 30 14 30 17 1 40 10 * 10 10 x& 
ErakA2L: 03 98 13.37 928 A 03 mo 8 


FaFfl 02 99 ao 1 1A - m = = 
FraLC 0.32.20. 48: +40: 9. FR) 2 es 

KOM 04 32 a A 7 AO - m - -.. 
KOM O9 03 3 2 a0 MA 8 AO - m - > 
KOM 05 3 2 36 2 16 38 02 ms - - 
K61BE > 65 cd. A ea, re = 
KOBE 04 5 339 2 1 A0 01m - - 


Tabelle 47: Beurteilung der Dialektalität des kurzen bzw. verkürzten dunklen 
A-Lauts (kdA) anhand der Merkmalsdistanz AC® des kurzen A (A) und des ver- 
kürzten A-Lauts. Ein für die Frankfurter Stadtmundart typisches, signifikantes und 
dialektales Muster bzw. eine binäre Dialektalität wird mit x markiert (Hauptbedin- 
gung Ad > 0,5; Nebenbedingung (1 < 3,5;). d misst hier den Merkmalsunterschied 
in der Kontrastgruppe [kdA A]. Signifikanzen a: xx: hoch signifikant; x: signifikant; 
‚ls‘: zu geringe Probenzahl; ‚th‘: Minimaldistanz nicht erreicht: ‚ns‘: nicht signifikant. 
COS: Bhattacharyya-Distanz als Maß für die Trennung der Verteilungen, — 1: ge- 
trennt; n: Probenzahl; w: Zahl der Stämme. Für Werte < 0,05 steht ‚—‘. Die untere 
Tabelle zeigt entsprechend die Unterschiede zum Dehnungs-A an (Ar). Verkürztes A 
unterscheidet sich für FraLD nicht vom kurzen A-Laut. 
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0 1 2 3 4 5) 
1700 1825 1850 1875 1900 1925 
mhd. Hauptperiode 1825 1850 1875 1900 1925 1945 HD 


EI, OU Frankfurt al a! aı/av 
wie (Mundart) 0000 ää/aa/äh/ah/.. a 
seif, (Oppel) a/ä 
vrouwe (Wülcker) „zwischen“ &/ä 

(Rauh) (&) ä 

Sachsenhausen A 

(Oppel) a 

(Rauh) ä 
ÖU Frankfurt a! a! oI aY 
we Mn Mn 
vröude (Rauh) ä oi 
-N Frankfurt ar a: aı/av 
wie On 
bein (Rauh) a 


Übersicht: Die wichtigsten Lautentwicklungen für das Monophthongierungs-A 
im Frankfurterischen, wie sie sich aus den Schriftbelegen ergeben (obere Zeile: er- 
schlossene IPA Lautwerte; untere Zeilen: originale Lautzeichen der Quellen; HD: 
Hochdeutsch). Der Lautwert änderte sich von einem palatalerem [a:]? zu einem 
neutralen [a:]*. Auslautendes historisches -N führte zu starker Nasalierung. Die 
Mundartdichtung nutzte unterschiedliche Grapheme für ein und denselben Laut, 
die hier mit Komma getrennt aufgeführt sind. 


9.8.1 Klassisches Frankfurterisch 


Die alten Diphthonge EI und OU wurden im Frankfurterischen zu einem langen A- 
Laut monophthongiert. Diese Entwicklung war in der Region völlig regelmäßig und 
betrifft auch die süd- und rheinfränkischen Dialekte rund um Frankfurt (Freiling 
[1924, 200-202], Freiling [1925], Urff [1926, 4], Born [1938, 88-93], Schnellbacher 
[1963, 412-413], Wiesinger [1970, 156-172, Bd. 2] und Wiesinger [1980, 95]). Der 
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regionale Lautwert dieses langen A-Lauts war in der Regel neutral und dem des 
neutralen kurzen A ähnlich, wenn nicht gleich. So hatte der Vordertaunus für 
altes EI z.B. [ha:zo], heißen (Schn: 230) und das Südhessische über Darmstadt 
für altes OU z.B. [gola:vo], gelaufe (Bo: 231.2). Während langes neutrales [a:] der 
Regelfall war, gab es vereinzelte Abweichungen, so etwa Monophthongierungen zu 
überoffenem Ä, wohl [er], im oberen Kinziggebiet (Wiesinger 1970, 170, Bd. 2) oder 
zu einem langen dunklen A, in dieser Arbeit als [a:] notiert, z.B. in Wallerstädten 
im Südhessischen unter Frankfurt (Bo: 88, 91). 

In manchen Dialekten der Region gab es auch eine divergierende Entwicklung, 
abhängig vom zugrundeliegenden Diphthong. So war z.B. im linksrheinischen Ge- 
biet um Mainz das A, was aus altem EI entstand, hell und das, welches auf altes OU 
zurückgeht, dunkel (VA: 169, 186). Die Mainzer Stadtmundart hatte eine abwei- 
chende Lautentwicklung. Hier entstand ein langer Ä-ähnlicher Monophthong mit 
dem Lautwert [er], falls EI zugrunde lag — entsprechend schrieben frühe Mainzer 
Dialektdichter des 19. Jahrhunderts ein (ä)-Graphem an den betreffenden Stellen, 
so etwa (Fläsch) für [fle:f], Fleisch (VA: 169, 173). Im Fall von OU hatte Mainz lan- 
ges dunkles A, so etwa [ax], Auge, das die Mundartdichter mit einem (a)-Graphem 
setzten, so hier z.B. (Aa) (VA: 186 und 191). All diese Dialektentwicklungen stehen 
in einem deutlichen Kontrast zum Hochdeutschen, das die Diphthonge bewahrt hat 
und zwar mit den Lautwerten [ar] und [av]. 

Welchen Lautwert hatte nun das Frankfurter Monophthongierungs-A? Und: 
Änderte sich dieser Lautwert im Lauf der Zeit? In der Frankfurter Mundartlite- 
ratur erschienen seit Ende des 18. Jahrhunderts häufig, wenn auch bei weitem 
nicht regelmäßig, (ä)-Grapheme neben (a)-Zeichen - ähnlich wie in Mainz, doch 
in Frankfurt mit (ä) sowohl für altes EI als auch OU. Friedrich Stoltze schrieb z.B. 
„Millerche: [...| merr waaß awwer nor net warum. |...| Was Gewisses wääß meır net. 
[...] Berjerkapitän: Odder waaßt de was“ (STL:1862:41) - man beachte, dass hier 
die Schreibung zwischen (aa) und (ää) für ein und dasselbe wissen innerhalb von 
zehn Zeilen schwankt. Ebenso bei Stoltze findet sich (Ääg) für Auge oder (ääch) 
für auch (STO). In Textors Prorector lautet es 1796 z.B. (haaßt) für heißt, (aane) 
für eine oder (aach) für auch neben (allähn) für allein, (Mihlstähn) für Mühl- 
steine oder (Borjermäster) für Bürgermeister (TEP: 10-13). Bei Malß findet man 
1821 im Bürgercapitain (Ageblick) für Augenblick, (aach) für auch oder (Kindtaaf) 
für Kindstaufe neben (kähn) für kein, (zwä) für zwei oder (mer wähs) für man 
weiß, aber auch (Frää) für Frau und (ich gläb) neben (ich glaab) für ich glaube 
(MAB: 13-33). 

Diese (ä)-Schreibungen werfen eine interessante Frage auf: Hatte das Frank- 
furterische einen dem Ä ähnlichen Laut für das Monophthongierungs-A, mögli- 
cherweise abhängig davon, ob EI oder OU zugrunde lag oder abhängig von den 
Folgekonsonanten? So schrieb der junge Rauh, bevor er Kenntnis des Oppel-Ma- 
terials erlangte: „Die von Stoltze in seinen Werken gebrauchte Schreibung ää für 
die alten Doppellaute gab somit die Aussprache seiner Zeit wieder“ (RAu: 227). 
Ist das korrekt? 
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9.8.1.1 Nasaliertes Monophthongierungs-A 


Zuerst soll das Frankfurter Monophthongierungs-A in der Stellung vor Nasalen 
untersucht werden, wie etwa in Wörtern wie Bein oder Stein — hier ist die Situa- 
tion noch vergleichsweise einfach und gut dokumentiert. Vor allem betrifft dies 
historisches -N im Auslaut oder an einer Wortfuge. Rauh hörte hier eine deutliche 
Nasalierung und gibt als Lautwert in Teuthonista (a) an, wobei sein (a)-Zeichen 
für das kurze neutrale A steht. Rauh merkt an: „Ganz allgemein kann gesagt wer- 
den, dass die Nasalierung in unserer Mundart stark ist, dass sie aber schwächer ist 
als im Französischen“ (RAU: 46). Eine auditiv-phonetische Beschreibung von nasal, 
die eben über das Vorliegen nasaler Aussprache hinausgeht, ist schwierig (Thin- 
nes 1981, 25). Was das A betrifft, tendiert Nasalierung, den Laut etwas ‚dunkler‘ 
erscheinen zu lassen. Entsprechend notiert Wülcker (1877, 27) für das nasalierte 
Monophthongierungs-A: „spricht [der Frankfurter] den anlaut stets a ausser bei 
folgendem nasale, der den anlaut verdumpft“. So soll hier das nasalierte Mono- 
phthongierungs-A mit [ä:] niedergeschrieben werden, wobei dasselbe Lautzeichen 
[a] wie für das dunkle A genutzt wird. Dieser Ansatz ist auch motiviert durch die 
IPA-Norm im Französischen, z.B. dans, [dä:], darin, mit dem das Frankfurterische 
ja oft in Bezug gesetzt wird!??. Damit lautete um 1920 im Frankfurterischen Bein 
als [ba:] und Stein als [[dä:], jeweils mit langem, deutlich nasaliertem [a!]. 

Diese Beobachtung für Hauptperiode 4 (1900-1925) scheint aus Apparent-Time 
Sicht auch für Hauptperiode 3 (1875-1900) zu gelten, denn Rauh vermerkte kei- 
nen Lautunterschied bei seiner älteren Generation. Aber Friedrich Stoltze schrieb 
in Periode 3 oft (Bää) und (Stää) für Bein bzw. Stein. War Ende des 19. Jahr- 
hunderts das nasalierte Frankfurter Monophthongierungs-A nun doch ein Ä-Laut? 
Seinen Mundartdichtungen legte Stoltze keine Ausspracheregeln bei, aber in seiner 
Frankfurter Latern machte er diesbezüglich Anmerkungen: 


„Die ä& im Frankfurter Dialekt werden wie das französische ain ausgesprochen; aber nicht 
alle. z.B. Mää, (Main) wie certain oder demain. Mää, Bää (Bein), Stää (Stein). Der Altfrank- 
furter sagt aber auch Maa, (Main) Baa, (Bein) Staa, (Stein). Diese nasalen Laute werden 
ausgesprochen wie das ean bei dem französischen Namen Jean“ (STL: 1888:52). 


125711 beachten ist, dass das alte Französisch, wie es um 1900 gesprochen wurde, zwei A-Laute 
auf einer Öffnungsstufe hatte: vorderes [a] wie in patte, Patze, [pat] und hinteres [a] wie in päte, 
Teig, [part]. Allerdings war diese Trennung schon Ende des 20. Jahrhunderts selten (Mettas u.a. 
1971). Der Lautwert des französischen hinteren offenen [a] entspricht nicht dem des Frankfurter 
[a], was ja in dieser Arbeit eine phonologisch motivierte Beschreibung für einen [>]-ähnlichen Laut 
ist, der auf ein altes A zurückgeht, sondern eher dem ‚echten‘ IPA-Lautwert von [a]. Allerdings ist 
der französische Nasalvokal [ä] wie z.B. in dans, [dä:], tendenziell vergleichbar mit dem Lautwert 
des Frankfurter [ä]. Es sei noch angemerkt, dass Nasalierung von A im Französischen in letzter 
Zeit dazu tendiert, den Laut immer O-ähnlicher werden zu lassen. Mertens (2001, 2-3) spricht 
von einem „glissement de /ä/ vers [5]“ und „La realisation de /ä/ comme [&/5], plus ferme&e et 
arrondie, est tres courante (45%) en 1993, quel que soit le niveau social, bien qu’elle semble venir 
de couches sociales döfavoris&es“. Nimmt man dies als eine Art Lautgesetz an, könnte eine solche 
Entwicklung auch in einem deutschen Dialekt ablaufen. [ä] und [5] scheinen im Französischen 
denselben Öffnungsgrad zu haben, etwa von [>], und unterscheiden sich vornehmlich durch den 
Grad der Lippenrundung (IPA 1999, 79). 
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Geht man noch weiter zurück, findet man bei Carl Malß Hinweise für die Ausspra- 
che um 1821 in seinem Wörterbuch des Bürger- Capitains: 


„Alle Endungen auf an, än, en |Anm.: so sie nasalierte Monophthongierungs-A sind] werden 
wie der bekannte französische Nasenton in dans, fin, lin u.s. w. ausgesprochen z.B. Hochd. 
allein, Frankf. allän wie franz. allin; Hochd. kein, Frankf. kän wie franz. kain; Hochd. kein, 
Frankf. kan wie franz. quand; Hochd. Bein, Frankf. Bän wie franz. Bain; Hochd. Stein, Frankf. 
Stän wie franz. Schtin. Dieser Nasenton bleibt auch bei den Endungen auf ein, aun, welche 
Diphthongen die französische Sprache nicht hat z.B. Mein —- Mei-n, Schein — Schei-n; braun 
— brau-n“ (Malß 1833b, 115). 


Setzt man die französische Normaussprache an, lagen also im Frankfurterischen 
vorgeblich IPA-[ar], aber auch IPA-[e:]-Laute vor, wie z.B. in quand, [kä], wann 
oder bain, [b£:], Bad. Nun ist nicht bekannt, wie gut die Französischkenntnisse der 
Mundartdichter waren. Wohl aber war der Klang des Französischen in Frankfurt 
des frühen 19. Jahrhunderts gängig, gab es doch mehrere französische Besetzungen, 
die erst nach Napoleon endgültig endeten!?®. Bei den Nasalisierungskonstellationen 
liegt der Schluss nahe, im (ä)-Graphem der Mundartdichter eine Nasalisierungs- 
markierung zu sehen, lautmalerisch, aber nicht exakt angelehnt an das Französische 
der Zeit. Zum Lautwert werden die Anmerkungen von Oppel Aufschluss geben, die 
im nächsten Abschnitt besprochen werden. 


9.8.1.2 Monophthongierungs-A in Normalposition 


Rauh transkribierte 1921 das Frankfurter Monophthongierungs-A in Normalpositi- 
on mit demselben Zeichen wie für das kurze neutrale Frankfurter A, aber eben lang, 
also (ä), und vermerkte keine Klangunterschiede (RAu: 42, 122f.). Entsprechend 
liegt es nahe, für das nicht nasalierende Monophthongierungs-A in Hauptperiode 4 
langes neutrales [a:] anzusetzen. Der qualitative Zusammenfall zwischen kurzem A 
und Monophthongierungs-A deckt sich völlig mit den Ortsgrammatiken der unmit- 
telbaren Umgebung, insbesondere für das Zentralhessische im Taunus (SCHn: 72), 
um Hanau (URF:4) und den unmittelbaren Vororten im Südhessischen (Bo: 227). 
Auch aus großregionaler Sicht gilt, wie z.B. auf den Karten 15-17 aus Wiesin- 
ger (1970) deutlich zu erkennen: Frankfurt lag tief in einem A-Gebiet für EI/OU, 
mindestens 50 km entfernt von der nächsten Lautgrenze'?”. 

Vermutlich war aber dieses lange frankfurterische Monophthongierungs-A nicht 
— oder zumindest nicht immer — von exakt gleicher Qualität wie das kurze frank- 
furterische A!?®,. Anzeichen für Unterschiede im Frankfurterischen finden sich in 


126711 den französischen A vgl. Fußnoten 125 auf S.353 und 131 auf $. 356. 

127Mit der singulären Ausnahme der Stadt Mainz als [e:]-Insel für - aber eben nur für — E1. Der 
Diphthong OU war in der Stadt dunkles [ar]. Das Mainzer Umland hatte neutrales [a:] für EI und 
ebenfalls dunkles [a:] für ou (VA: 378 und 383). 

128Selbst für die normativ identischen [a/a:] des Hochdeutschen lassen sich ja auch mit dem 
VOKALJÄGER noch geringe Unterschiede messen (vgl. Abschnitt 4.6.3 ab S. 157). Ebenso ist z.B. 
für Valentin (1934, 11) das hochdeutsche kurze A „etwas getrübt“ und das lange A ein „heller“ 
Laut, aber er verwendet dasselbe Lautzeichen mit (a) bzw. (ä). 
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den Belegen des 19. Jahrhunderts. Leider gibt es - anders als für das nasalierte 
Monophthongierungs-A — keinerlei Anmerkungen zur Aussprache durch Mundart- 
dichter, sondern nur die verwirrenden Schreibungen mit (ä). Wülcker (1877, 27) 
versuchte eine Herleitung der Frankfurter Lautung des Monophthongierungs-A um 
1877 mit der ‚progressiven Assimilation‘ nach Sievers: 


„So entstand ein nach i oder nach u hin gefärbtes a, also ein & oder ö-artiger ton. Die immer 
grössere entfernung vom auslaute [...| brachte einen immer mehr dem ä sich anähnlichenden 
klang zum vorscheine und musste einen gleichen laut für beide, einst so fern stehende di- 
phthonge herausbilden. Bei weiterer ungestörter entwicklung müssten sie & werden, mit dem 
sie aber noch nicht ganz zusammenfallen [...]. Heute [Anm.: 1877] klingen die alten ai (ei) 
und au gleich und es ist ein ton entwickelt, der die mitte zwischen &4 und & hält.“ 


In unseren Tagen ist es nicht mehr ersichtlich, welchen Lautwert Wülckers (ä) 
hatte. Es könnte das Bühnen-A des Hochdeutschen sein oder aber der Frankfurter 
lange dunkle A-Laut, den Wülcker an anderer Stelle mit diesem (ä) in Bezug setzt. 
Wichtig ist nun zweierlei: zum einen schien Wülckers Monophthongierungs-A eine 
Tendenz hin zu den Vorderzungenvokalen zu haben, seinem (&) — also vermutlich 
palataler bzw. heller als das neutrale A und vor allem heller als das dunkle A. 
Zum anderen aber war Wülcker dieser Unterschied nicht wesentlich oder ausge- 
prägt genug, ein eigenes Zeichen dafür einzuführen. So lag wohl noch Ende des 
19. Jahrhunderts eine leichte Palatalisierung vor - in Hauptperiode 4 war sie aber 
als Leitform verschwunden. Rauh notierte 1920 nur noch als Relikt „die in der 
Sprache der alten Frankfurter mitunter noch zu beobachtende palatale Färbung 
des aus mhd. ei und ou monophthongierten (ä)“ (RAU: 227). Auch in Rödelheim 
und Bonames hörte er ein „palatal“ gebildetes Monophthongierungs-A für EI und 
OU, welches „heller klingt als in Frankfurt“ und möglicherweise dem alten Zustand 
nahe war (RAU: 10). 

Die ausschlaggebende Information kommt von Oppel. Dieser nutzte durchge- 
hend von 1839 bis 1894 zwei (!) verschiedene Vokalnummern für seine tendenziell 
neutralen A. Das kurze, bei ihm als „rein“ bezeichnete A hat die Nummer 1 und er 
schrieb es als (a) (vgl. Abschnitt 9.3.1 ab S. 297). Das Frankfurter Monophthongie- 
rungs-A hingegen bekam die Nummer 2 und wurde von ihm (ä) geschrieben'””. Die 
Vokalnummer 2 ist ausschließlich dem Monophthongierungs-A vorbehalten. Mehr 
noch: Oppel bringt eine vom (a) abweichende Beschreibung mit „2 beschreibt den 
Laut a zwischen a und ä, wie in / had, a bat. 3 beschreibt den Laut ä zwischen a 
und e in der Mitte“ (OPF: 1.1.1)'?°. Nun ist nicht bekannt, wie gut Oppel Englisch 
konnte. Die heutige Norm setzt für die Wörter (IPA) [had] bzw. [bet] an und [x] 


129Nur und nur im ersten Faszikel in seiner zentralen Lautdefinition nutzte Oppel neben (ä) 
zusätzlich das Zeichen (a) — ganz gleich Rauhs Zeichen des palatisierten A - für das Mono- 
phthongierungs-A. In allen anderen Faszikeln schrieb er mit dem üblichen Kurrent-A und die 
Markierung erfolgt ausschließlich durch die Vokalnummer (2) (vgl. Fußnote111 auf S.298). 

130Dje betreffende Textstelle ist übrigens in einem frühen Faszikel zu finden. Dieses und weitere 
frühe Faszikel enthalten Aufzeichnungen zum Aachner Dialekt — die zu Frankfurt setzten erst 
später ein. Und der Aachner Dialekt hat [e:o]-Varianten für die EI-Monophthongierung (Wiesin- 
ger 1970). Entsprechend setzt Oppel für nhd. Fleisch, mhd. vleisch Aachnerisch (Fläasch), was 
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liegt für das Englische auf einer Öffnungsstufe mit IPA-[a] und ist ähnlich weit 
vorne artikuliert, wie das etwas geschlossenere [e] (Delattre 1965, 50). 


9.8.1.3 Der Lautwert im 19. Jahrhundert 


Hervorzuheben ist: Oppel hörte, Wülcker gleich, einen unterschiedlichen Klang 
zwischen neutralem A, seinem (a), und dem Monophthongierungs-A, seinem (ä), 
was ihn dazu bewog, zwei Vokalnummern für A zu führen. Seine Notation von 
(a) gegenüber (ä) behielt er über alle Faszikel bis zum Tod hin bei. Aber - und 
das ist das Wesentliche - niemals nutzte er für das Monophthongierungs-A die 
Vokalnummer 3 für den Ä-Laut, sein (ä). Folglich war zu Oppels Zeiten das Mo- 
nophthongierungs-A kein offener Ä-Laut bzw. kein [eı]. 

Im Zentralhessischen ist das Monophthongierungs-A nach den Ortsgrammati- 
ken der Zeit ein neutrales [a:]. Setzt man diesen Laut auch für Sachsenhausen im 
19. Jahrhundert an, haben wir mit Oppel noch ein weiteres Indiz für den beson- 
deren Frankfurter Laut: Oppel notiert Sachsenhäuser Monophthongierungs-A mit 
der Vokalnummer des neutralen frankfurterischen A, der 1, also (ä), was abweicht 
von seinen Frankfurter Belegen für das Monophthongierungs-A, die alle mit der 
Vokalnummer 2 erscheinen, also (a). Dieser Unterschied erscheint belastbar, da er 
von Oppel explizit, kontrastiv und wiederholt angegeben wird. So notiert er z.B. 
bei hauen (häache) für Frankfurt und schreibt dahinter „Fr. 2. Sachs. 1“, um expli- 
zit den Lautunterschied zwischen Frankfurt, Vokalnummer 2, und Sachsenhausen, 
Nummer 1, zu markieren. Damit war das Sachsenhäuser Monophthongierungs- 
A dem neutralen A gleich, das Frankfurter hingegen nicht. Das Gleiche gilt für 
das ebenso zentralhessisch geprägte Bornheim. Im April 1852 notierte Oppel ein 
(wäaßte) für weißt du, ebenso mit dem neutralen A der Nummer 1. In Frankfurt 
hörte er im Unterschied dazu (wäß), mit Vokalnummer 2, in ich weüß. 

Somit haben wir mit Oppel und Wülcker zwei Zeugen für ein leicht aus der 
Neutralposition abweichendes Monophthongierungs-A. Wahrscheinlich waren so- 
mit langes Monophthongierungs-A und kurzes neutrales A nicht (immer) von glei- 
cher Qualität, aber sicher war das Monophthongierungs-A niemals ein [e]-Laut. 
Wahrscheinlich ist im 19. Jahrhundert ein helleres, palataleres A. Dieses helle A 
wird von Rauh als ein „sehr palataler (ä) haltiger (a) Laut bezeichnet“ und mit 
dem Lautsymbol (a) versehen (RAu: 47.1 und 227). Hier soll es mit [a] transkri- 
biert werden, auch in Abgrenzung zum neutralen [a]'?'. Zu Rauhs Zeiten war der 


hier vermutlich für ein [fleraf] oder [fleref] steht. Oppel hat strukturkonservativ sein Schema 
beibehalten, als er begann, Notizen zu Frankfurt machen. 

131Das helle (a) käme „am nächsten den französischen hellen Kürzen in a, z.B. in Paris“ 
(Rau: 42.1). In welchem Bezug aber steht, das französische neutrale A, wie eben in Rauhs Eich- 
punkt Paris, [paril, zum deutschen neutralen A? Strange u.a. (2007, 1127-1128) vergleichen 
phonetisch die moderne (nord)deutsche Normsprache mit dem Pariser Französisch anhand der 
Formanten. Daraus lässt, sich eine grobe Abschätzung entwickeln: Das französische A ist aus 
Sicht des deutschen A etwa 20% weiter vorne artikuliert (wenn man deutsches E und A als Be- 
zugspunkte wählt und F2 als Maßzahl). Auch Fougeron/Smith (1999, 78) bzw. Kohler (1999, 
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Unterschied im Wesentlichen verschwunden. 

Entsprechend soll der Lautwert des Monophthongierungs-A im 19. Jahrhun- 
dert, insbesondere in Hauptperiode 2, mit [a:]? und im 20. Jahrhundert, vor allem 
in Periode 4, mit [a:]* geschrieben werden. Der Hauptunterschied zwischen dem 
postulierten ehemals langen hellen Monophthongierungs-A und dem kurzen neu- 
tralen A ist aber die Quantität. 


9.8.1.4 Der Umlaut des Monophthongierungs-A 


Von den alten Diphthongen EI und OU war nur der zweite umlautfähig: altes OU 
lautete zu altem ÖU um. Im Frankfurterischen sind Wörter, die auf altes ÖU zu- 
rückgehen, ebenfalls monophthongiert zu A. Solche Formen sind allerdings auch 
in der Region selten (Wiesinger 1970, 157). Für das Frankfurterische galt z.B. 
für nhd. Freude, [frovdo], aus mhd. vröude ein [frart] mit Monophthongierungs-A. 
Solche archaischen Formen aus eingefrorenem alten ÖU waren allerdings zu Rauhs 
Zeiten schon fast ausgestorben und konnten „nur hin und wieder noch bei alten 
Leuten gehört werden“ (RAU: 126 Anm. 1). In den 1930ern schreibt Rauh: „Heute 
fraat sich der Frankfurter nicht mehr, er freut sich“ (Rauh 1939, 638). 

Im Regelfall bildeten EI und OU zuerst ein Monophthongierungs-A und laute- 
ten dann produktiv zu einem Ä-Laut um. Diese Analogie-Umlaute sind im Rhein- 
fränkischen und Zentralhessischen üblich (Wiesinger 1970, 157 und 169). Für das 
Frankfurterische hieß es dann entsprechend [le:fst] für läufst aus mhd. loufen und 
oder [be:m] für Bäume aus mhd. boum (Rau: 128). Der genaue Lautwert des Um- 
lauts schwankte allerdings. Rauh beschrieb ein „Nebeneinander“ von offenem [er] 
und geschlossenem [e:], wobei das [e:] bei ihm die Leitform war. Bei Oppel ist es ge- 
rade umgekehrt: er notierte durchgehend (6), also geschlossenes [e:]. Während die 
Sachsenhäuser Form nach Oppel geschlossenes [e:] war, vermerkte Rauh, dass der 
Ort „zu offener Aussprache der e-Laute neigt“ (RAu: 124 Anm. 1). Rauh notierte 
entsprechend ein Teuthonista (&), was hier ebenso als [x] geschrieben werden soll 
(zu den zwischen Rauh und Oppel schwankenden E-Qualitäten vgl. auch Punkt 2 
auf S. 410). 

Folglich - und das ist das Wichtige hier — hatte das Frankfurterische nun sehr 
wohl einen Ä-Laut für das Monophthongierungs-A, aber dies ist nicht das Mo- 
nophthongierungs-A in Normalposition, sondern der Umlaut des Monophthongie- 
rungs-A. Dieser konnte jedoch in für das Hochdeutsche unbekannten bzw. uner- 
warteten Positionen auftreten. 

Während Umlautbildung bei OU auch für das Hochdeutsche möglich ist - dem 
mhd. Paar mhd. boum - böume steht das nhd. Paar Baum - Bäume gegenüber 


87) sowie Delattre (1965, 49) zeigen eine leichte Vorwärtverschiebung an. Damit kann das fran- 
zösische A bzw. ein ähnlich klingendes altes Frankfurter Monophthongierungs-A dem deutschen 
Hörer palatal oder heller erscheinen (Zum französischen dunklen A vgl. Fußnote 125 auf $.353). 

Abschließend sei noch angemerkt, dass Rauh um 1920 kurzes [a] als einen neuen Laut der 
Schulkinder für U und O vor -RT/-RST beschrieb, so z.B. in Wurst, [vaft]?, anstatt dem sonst 
üblichen [voe/ft]*%; vgl. auch S. 288. 
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— gibt es keinen Regelumlaut bei EI. So ist eine Flektionsform von heißen im 
Hochdeutschen es heißt und der Diphthong [ar] bleibt erhalten. Der Frankfurter 
hatte dagegen [ha:zo] für heißen. Seine Flektionsform ist nun [herst] mit einem 
Ä-Laut. So schreibt Oppel (dö hästs) und zeigt mit der Vokalnummer 3 eindeutig 
Ä-Klang an (OPZ:1.28.6). Die Besonderheit der Umlautbildung bei heißen kom- 
mentiert Oppel mit einem „[der] Laut konjugiert!“ (OPF: 1.258) und Freiling (1924, 
201) fasst zusammen: „Wo in Frankfurt noch ein e oder ä scheinbar dafür [Anm.: 
Schreibung eines Monophthongierungs-A] vorkommt, ist es Umlaut zu diesem a, 
so hääst, heißt, hääser, heißer“. 


9.8.1.5 Die Auflösung der Ä-Wirrung 


Was aber ist nun der Grund für die so verwirrenden (ä)-Schreibungen der Frankfur- 
ter Mundartliteratur des 19. Jahrhunderts? Es sind folgende Erklärungen denkbar: 


1. Das Frankfurterische hatte durchgehend einen Ä-Laut für Monophthongie- 
rungs-A, der mit einem (ä)-Graphem angezeigt wird — diese Hypothese ist 
zu verwerfen. Oppels Aufzeichnungen beweisen eindeutig, dass der Klang nicht 
der eines [e] war: Oppel verwendet niemals die dem Ä entsprechende Vokal- 
nummer 3, sondern immer nur die 2. Weder Wülcker noch Rauh hörten einen 
expliziten Ä-Klang und verzichten auf unterschiedliche Lautzeichen für neutra- 
les A und Monophthongierungs-A. Das Gleiche berichtete Freiling (1924, 201) 
auf der Suche nach dem vermeintlichen Ä-Laut des Monophthongierungs-A: 
„Weder in Frankfurt noch weit und breit in der Umgebung ist auch nur eine 
Spur von ä für ei oder au zu finden“. 


2. Das Frankfurter Monophthongierungs-A des 19. Jahrhunderts hatte einen hel- 
leren und vermutlich palataleren Klang, hier: [a:], der mit einem (ä)-Graphem 
angezeigt wird — dies ist vermutlich korrekt. Der späte Rauh setzt das Mono- 
phthongierungs-A des 19. Jahrhunderts als ein „helles langes a, ähnlich dem 
französisch hellen a in Paris“ an (Rauh 1939, 634). Die Mundart der 1930er 
spreche an diesen Stellen „kein helles a mehr aus“. Rauhs Hypothese deckt sich 
mit den Beschreibungen von Wülcker und Oppel, die beide das Monophthon- 
gierungs-A als einen Mittellaut aus A und E beschreiben, der aber eben noch 
nicht Ä ist. Dies wird unterstützt durch Oppels Beobachtung, dass das wohl 
neutrale Sachsenhäuser Monophthongierungs-A vom Frankfurter A an dieser 
Stelle abwich. 


3. Das Frankfurterische lautete gegebenenfalls das Monophthongierungs-A zu Ä 
um, was mit einem (ä)-Graphem angezeigt wird — dies ist belegt. Da das 
Umlaut-Ä an Stellen auftreten konnte, wo das Hochdeutsche nicht umlautet, 
nämlich bei auf Ei zurückgehenden Wörtern, erscheinen diese Ä unerwartet, 
sind jedoch phonetisch-phonologisch völlig zulässig. 
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4. Das Frankfurterische nasalierte das Monophthongierungs-A insbesondere vor 
auslautendem historischem -N stark und das (ä)-Graphem ist eine Nasalisie- 
rungsmarkierung — für diese Hypothese spricht, dass sich die bekannten (ää)- 
Erläuterungen der Mundartdichter Malß und Stoltze nur auf diese Konstellati- 
on beziehen. Bestärkt wird diese These abermals durch Oppel: Dieser schreibt 
öfter (ä) an diesen Stellen, markiert aber mit seiner Vokalnummer 2, dass eben 
kein Ä-, sondern ein A-Laut vorliegt. Nasalierung wird zusätzlich mit geklam- 
mertem „n“ angezeigt: ((n)). Beispiele sind (Bä(n)) für Beine, [ba:], (kä(n)s) 
für keins usw. 


5. Das (ä)-Graphem markiert den helleren Klang des Monophthongierungs-A ge- 
genüber dem dunklen Dehnungs-A - lange A sind im Frankfurterischen üb- 
licherweise dunkel mit [a:] und stehen somit, bei gleicher Quantität, in Kon- 
trast zu dem langen neutralen bis helleren Monophthongierungs-A mit [a:]. Da 
gedruckte Mundartliteratur auch von den vielen in Frankfurt Arbeit suchen- 
den Nicht-Mundartsprechern gelesen werden sollte, mussten die beiden A mit 
unterschiedlichen, allgemeinverständlichen und einfach verfügbaren Schriftzei- 
chen gedruckt werden. So konnte man das Monophthongierungs-A im Druck 
mit (ää) setzen - einer Zeichenfolge, die das Hochdeutsche nicht hat - und das 
lange dunkle A bei (aa), (ah) usw. belassen. Durch die Wahl von (ää) konn- 
ten beide Elemente abgedeckt werden: zum einen der postulierte leicht hellere 
Klang, vor allem aber der Kontrast zum dunklen Dehnungs-A. Dies muss al- 
lerdings Hypothese bleiben, da es unmöglich war, unterstützende Belege, wie 
z.B. Textsatzanweisungen bei Mundartdrucken, aufzufinden. 


Vermutlich sind fast alle Erklärungen zu einem gewissen Grad gültig, mischten 
sich und konnten im Lauf der Zeit nicht mehr auseinandergehalten werden. Sicher 
ist nur, dass die erste These zu verwerfen ist: Frankfurt hatte niemals ein Ä bzw. 
[e:] als Monophthongierungs-A. 

Der Textsatz mit (ää) sorgte im Lauf der Zeit in Frankfurt für erhebliche Ver- 
wirrung: 


„Viele Mundartleser, darunter selbst Frankfurter, wurden durch die @ä-Schreibung dazu ver- 
führt [...], ein ö zu sprechen, wie es in schriftsprachlichen Fällen wie Gräber oder Läden vor- 
liegt. Sie glaubten dies mit umso größerer Berechtigung zu tun, als man Friedrich] Stoltze als 
einen Richter in mundartlichen Dingen und seine Sprache als die einzig richtige Frankfurter 
Mundart ansah“ (Rauh 1939, 634). 


Da sich selbst Friedrich Stoltze zu Lebzeiten nicht einheitlich an die (ää)-Schreib- 
weise hielt, Fehlinterpretationen Tür und Tor geöffnet wurde und keine echte Not- 
wendigkeit bestand, erschien in Mundartdrucken des frühen 20. Jahrhunderts der 
(ää)-Satz nicht mehr: „Deshalb wurde mit der irreführenden ää-Schreibung gebro- 
chen“ (Rauh 1939, 635). Der Stoltze-Herausgeber August Hase empfand es 1939 für 
eine Neuauflage als seine „Pflicht, |...] kleine Verbesserungen |...] der Umschreibung 
des Dialekts“ zu ergänzen und klarzustellen: 
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„Der Umlaut äd, so wie ihn Stoltze z.B. für die Wörter Mää = Main oder Stää = Stein 
gebraucht hat, wurde und wird auch heute nur als aa, z.B. Maa oder Staa für Main und Stein 
gesprochen. Ursprünglich hielt sich auch Stoltze an die heute noch gebräuchliche Sprechweise 
von Maa und Staa, was er eigentümlicher Weise und ohne besondere Begründung in den 
späteren Schriften in Mää und Stää verwandelte“ (Hase 1939, 5). 


9.8.1.6 Analogmonophthongierung der altlangen | und Ü 


Dem nicht germanistisch vorgebildeten Mundartsprecher ist es nicht ohne weiteres 
ersichtlich, warum z.B. ein hochdeutsches [aı] im Frankfurterischen zweierlei Ent- 
sprechungen hatte: Das in diesem Abschnitt beschriebene Monophthongierungs-A 
des mittelhochdeutschen EI etwa lautet im Hochdeutschen [ar]. Die Weide (Wie- 
se) aus altem weide lautete z.B. im Frankfurterischen [va:rt] mit Monophthong 
[a:], im Hochdeutschen spricht man hingegen [vaıdo] mit erhaltenem Diphthong 
[ar]. Aber hochdeutsches [ar] kann auch auf altlanges I zurückgehen, das spät- 
mittelhochdeutsch diphthongierte: die Weide (Baum) aus altem wide lautete im 
Frankfurterischen [vart] mit Diphthong [ar] - das ist derselbe Vokal wie im Hoch- 
deutschen, das hier [vaido] hat. Schön ist folgender Beleg, der beide Wörter in 
einem Satz enthält: „|[...| da wärn als die Kie uff der Waad, unner dene Bapplwei- 
de* (OP:1.54.14). Weide als Wiese und Weide als Baum hatten also im Frank- 
furterischen unterschiedliche Laute, je nachdem ob sie auf altes EI oder altes I 
zurückgehen - das Hochdeutsche hat nur den einen Laut [ar]. 

Vermutlich hyperkorrigierten neu zugezogene Mundartsprecher oftmals [ar] aus 
altem i zu dialektal unerwartetem [a:], was sich dann „mitunter |...] besonders 
vor ch und m“ durchsetzte (RAu: 115.5). Rauh hörte [la:m] für Leim, [jtra:30] 
für streichen, |[ba:l] für Beil und [a:z&n] für Eisen, die allesamt auf altlanges i 
zurückgehen!?2. 

Ebenso verhielt es sich mit [a:] aus altlangem Ü - hier hat das Hochdeutsche 
durchgehend [av] für den alten Diphthong OU, aber eben auch für altlanges Ü. Das 
Frankfurterische hatte [a:] für OU und regelmäßig [av] für Ü. Aber z.B. in [pra:yo], 
brauchen; |da:yo], tauchen und [ra:ma], räumen, die allesamt auf altlanges Ü zu- 
rückgehen, finden sich Hyperkorrekturen (RAU: 119, Anm. 1). Ein prototypisches 
Beispiel für fehlerhaft erlernten Dialekt ist der Mundartdichter Ettlinger, der als 
Münchner Texte in Frankfurterisch schrieb und dabei auch hyperkorrekte Formen 
verwendet, z.B. 1907: „weil mer noch e paar Ziege braacht“ (FWB, 374; vgl. auch 
Hock [2011] zu Ettlinger). 

Rauh vermeinte später in diesen Hyperkorrekturen eine lautgesetzliche Bewe- 
gung zu erkennen: „Neuerdings zeigen auch die aus mhd. i und ü entstandenen 
Doppellaute ai und au starkes Bestreben in einfaches a überzugehen“ (Rauh 1925, 
84). Oppel hörte noch durchweg die alten Formen. Die Hyperkorrekturen setzen 
erst in der zweiten Hälfte des 19. Jahrhunderts ein (vgl. Belege unten). 


132Für Leim vermutete Rauh eine Vermischung mit Lehm aus altem leime als Erklärung. 
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9.8.1.7 Die Verdunklung des Monophthongierungs-A 


Das Frankfurterische hatte somit fünf A-Laute bzw. A-Qualitäten: das kurze neu- 
trale [a], das lange dunkle [ar], das gekürzte dunkle [a], das neutrale bis helle 
Monophthongierungs-[a:] und das nasalierte Monophthongierungs-[ä:]. Sie stan- 
den teilweise in Opposition zueinander, was sich z.B. in den Minimalpaaren nhd. 
heiß, mhd. heiz, kFra. [ha:s] zu nhd. Hase, mhd. hase, kFra. [ha:s] zu nhd. Hass, 
mhd. haz, kFra. [has], zeigt. 

Es scheint Ansätze im Frankfurterisch der Hauptperiode 4 und 5 gegeben zu 
haben, den Unterschied zwischen langem hellen A und langem dunklen A aufzulö- 
sen und somit die eben beschriebene Komplexität des Dialekts zu reduzieren: „Die 
alten a-Laute waren verdunkelt; das aus mhd. eöiund ou entstandene (ä) |...] zeigt] 
bereits schon wieder deutlich das Streben zur Verdunklung“ (Rauh 1921b, 58). Das 
betraf auch Wörter in Normalposition, also in nicht-nasaler Stellung. Das scheint 
Bestätigung bei Broxten (1985, 43) zu finden. Sie beschreibt das Monophthon- 
gierungs-A der 1980er, so etwa in auch oder Auge als einen „dumpfen“ Laut — 
allerdings nur und nur noch bei älteren Leuten. So mag man als Hypothese wagen, 
dass, zumindest in Einzelfällen, das ursprünglich neutral-helle Monophthongie- 
rungs-[a:] des Frankfurterischen in der Spätphase des Stadtdialekts den Ausgleich 
mit dem dunklen Dehnungs-A hin zu einem langen dunklen [a:] suchte, dann sich 
aber wieder an die hochdeutsche Norm mit [a:] annäherte und die Verdunklung 
aufgab. 


9.8.2 Ausgewählte Schriftbelege 


1. Monophthongierungs-A in Normalposition: 


(a)EI > [a]? [a]? > ha.far] 
» Eier. (eiger). & [aj&]*: Rau*, 122.1: aiä. — » Fleisch. (vleisch). > 
[Ha:f]?: OPZ?, 11.2.4: Fläsch. WS?, 19: Flaasch. > [fla:f]*: Rau‘, 122.1: 
flas. > [fla:[]’: RauKt, 58: Fleisch, „wieder deutlich das Streben zur Ver- 
dunklung“. © Bornheim, Eckenheim, Sachsenhausen: D [a:]?: WS?, 19: 
Flasch, Flaasch. © Oberrad: > [a:]®*: WS?, 19: Flasch. FR25°*, WS19: 
Flaasch. — » heilen. (heilen). > [ha:lo]”: OPF?, 1.159: mit haaler Haut. 
OPZ?, 1.45.10: gehalt wern. OPZ?, 1.36.4: ich häl, du hälst, er hält. > 
[ha:lo]*: Raut, 122.1: halo. — » heiß. (heiz). > [ha:s]?: OPZ?, IL11.10: 
briehass. OPF?, 1.195: haake Köhle. WS, 6: haaß. > [ha:s]*: Rau“, 122.1: 
häs. & Umlaut: heißer: » [he:z&]: FR24, 201: hääser (heißer, Ä-Laut). © 
Bornheim, Eckenheim, Sachsenhausen: > [ar]: WS®, 19: has, haak. © 
Oberrad: > [ar]: WS?, 19: haß. FR25%', WS19: haak. — » heißen. 
(heizen). > [ha:zo]?: OPF?, 1.186: haaß (ich heiße). OPF?, 1.396: hat 
gehäße. > [ha:zo]*: Rau?, 189.1: häso. RAU!, 124, Anm. 3; 189.2: häst, 
„Nicht umgelautetes ‚er heißt‘ ist analog der übrigen Präsensformen dieses 
Verbs gebildet“. & Umlaut: er heißt: » [heist/hesst]: OPF?, 1.138: hääßt 
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(heißt). OPF?, 1.138: haaßts (heißt es). FR24, 201: hääst (Ä-Laut). Rau“, 
124: höst. Rau*, 124, Anm. 2: höst, „regelmäßtiges Nebeneinander“. © 
Sachsenhausen: & Umlaut: » [hast]: RAu?, 124 Anm. 1: hast. © Born- 
heim: » [»:]: OPF?, 1.422: häßt, „April 1852 — »Kleid. (kleit). > 
[kla:t]”: OPZ?, 1.24.4: Klad. OPZ2, 147.4: Kladche. OPF?, 1.150: Kläder. 
> [klart]*: Rau! ‚122.1: klat. A > [ar]: "Ww83, 17: Kleider. © Born- 
heim, Sachsenhausen: > [a:]?: WS®, 17: Klaader, Kiader © Eckenheim: 
> [a:]?: WS?, 17: Klarer. © Oberradi [ä]®*: WS?, 17: Klader. FR25°%: 
Klaader. — > Seife, Ge. > [saıf?: OPZ?, 1.22.1: Weschsäf. WS?, 32: 
Saaf. > [sa:f]*: Rauf, 164.1: saf. © Bormheim: Eckenheim, Sachserihäir 
sen: D [a]: WS?, 39: Saf, Saaf. © Oberrad: > [a]’*: Wws3, 32: Saf. 
FR25°%%: Saaf. — » weiß < wissen. (weiz). > [va:s]”: OPF?, 1.233: ich 
wäß wäs ich wäß. OPF?, 1.209: da waaß mer. OPF?, 1.505: du wäßt. © 
Bornheim: > [a:]?: OPF?, 1.422: waaßte (weißt du; April 1852). — » zwei. 
(zwei). & [tsva:]?: OPF?, 1.159: zwa. WS?, 33: zwa. > [tsva:]*: Rau“, 
122.1: tswat, tswäat (zweit). Andere: D [ar]: BRO®, SpA, 33: tswär © 
Bornheim, Eckenheim, Sachsenhausen: > [a:]’: WS?, 33: zwa, zwaa. © 
Oberrad: > [a:]**: WS?, 33: zwa. FR25%*: zwaa. 


E-m > [al]? [a]? > ha.faı] 

» feimen. (feimen). > [farmo]”: OPF?, 1.327: erausfame. © Sachsenhau- 
sen: > [aıl: OPF?, 1.335: „sachs. 1% &. — > Heim. (heim). > [harm]?: 
OPF?, 1.161: haamschicke. OPF?, L518: ham kimmt. > [harm]*: Rau“, 
122.1: ham. © Öberrad: > [ ‚ja: FR25°: hoamgih, hoamkumme. Fra5t: 
hoamgeh, hoamkomme. 


rn 
og 
— 


zn 
(@) 
Du 


m-EI > [a] [a]? > ha.[aı] 
» Meister. (meister). > [ma:sd&]’: OPF?, 1.501: Mäster. > [ma:sd&]?: 
Rau“, 160.2.a: mäsdä. 


ou > [a]’ + [al > hd.[ao] 

» auch. (ouch). > [ax]: OPF?, 1.105: aaach. WS?, 10: aach. > [a:x]*: 
STo?, 212: ääch. Rau“, 126.1: aX. Andere: > [är/au]: BRO®, SpA, 32: ärx. 
BRO’, SpB, 35: au. © Bornheim, Eckenheim, Sachsenhausen: D [a:x]?: 
WS?, 10: ach, aach. © Oberrad: > [a:]®*: WS?, 10: ach. FR25°*: aach. — 
> Auge. (ouge). > [a:x]: OPF?, 1.195: Aache. WS?, 27: Age. STO?, 229: ins 
Ääg. > [arx]®°: Raut, 126.1: äx. RAUZ°: werr net frech, du, wie e gewid- 
der haste en Knibbel am Aach. RAUZ°: knäläch. Andere: > [är/au]: BRO®, 
43: äıxa. BRO’, SpB, 35: ärxn. BRO’, SpC, 37: auxn. © Bornheim, Ecken- 
heim, Sachsenhausen: D [a:]?: WS?, 27: Aage, Age. © Oberrad: > [ar]?: 
FR25°: Aage. — » Baum. (boum). > [bam]”: OPF?, 1.335: Bam. OP2?, 
1.17.5: bah(n)wollene (baumwollen). Op?, 11.2.5: bäh(n)wollene. > [baxm]*: 
RAU?, 126.1: bam. & Umlaut: Bäume (böume): » [berm]?: OPF?, 1.335: 
Beem (Bäume). » [berm/berm]': Rau’, 128.1: bem. Rau‘, 128.1 Anm. 
1: &, „Nebenform“. © Sachsenhausen: > [ba:m]?: OPF?, 1.335: „sachs. 


rn 
m 
— 
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1“ &. & Umlaut: » [berm]?: OPF?, 1.335: „sachs. Pl. 4% &. » [baem]*: 
Rau‘, 128.1 Anm. 2: &. — » Frau. (vrouwe). > [fra:]”: MaAB°, 31, 68: 
Frää, Fraa. OPZ?, 11.28.7: Bauerschfra. OPZ?, 1.25.9: Fra. OPZ2, 113.7: 
Fraa. WS?, 9: Fraa. STo?, 726: Frää. D [ra] : Rau, 126.1: en 6) 
Bornheim, Eckenheim, Sachsenhalisen: D [a]: WS?, 8: Fra, Fraa © 
Oberrad: > [a a ws, 9: Fra. FR25°*: Fraa. u slanben. (gelouben). 
> [kla:vo]: OPZ?, 1.30.8: ich gläb. OPZ?, 1.41.11: kläbste. WS®, 8: glab. 
> [kla:vo]*: Raut, 126.1: klawo. © Bornheim, Eckenheim, Sächsenhait: 
sen: D [a:]’: WS?, 8: glab. © Oberrad: > [a:]®*: WS?, 8: glab. FR25°: 
glaawe. FR25*: glaab. — » hauen. (houwen). > [ha:ryo]”: OPF?, 1.322: 
dörchhaach® (durchhauen). > [haryo]‘: RAUZ?, MW: goha"o. & Umlaut: 
du haust: » [herfst]: Rau‘, 128.1: hesst. © Sachsenhausen: > [haryo]?: 
OPF?, 1.322: „sachs. 1° ä. & Umlaut: du haust: © [ha:fst]: RAu?, 128.1 
Anm. 2: &. — » kaufen. (koufen). > [k"a:vo]’: OPZ?, 1.13.3: Kaf. mer 
muß kaafe. > [k"a:ve]*: RaAu?, 126.1: khävo. Rau‘, 164.2: khäfman. & 
Umlaut: du käufst: — [kPerfst/kPerfst]: Rau?, 128.1: khefst. RAau?, 128.1 
Anm. 1: khefst, „Nebenform “. Rau?, 128.1: kheft (er kauft). © Sachsen- 
hausen: & Umlaut: er kauft: — [kraft]: Rau*, 128.1 Anm. 2: khäft. 
— »Jlaufen. (loufen). > [lavo]”: OPZ?, 1.34.13: So laf. OPZ?, 11.23.3: 
sie laafe wie die Alte. WS?, 8: gelafe. OPF?, 1938: laaf nperaiin): > 
la: vo]®: RAU“, 126.1: lavo. & Umlaut: er au le: ft]2: OPF?, 1.514: 
er left (er läuft). OPF?, 1.185: da laaft (läuft). » [le: Eue fst]t: Raut, 
128.1: lefst. Rau! ‚128.1 Anm. 1: löfst, „Nebenform “. RAu*, 128.1: left (er 
läuft). RAu*, 128.1: lef (Läufe des Wilds). © Sachachhalsen: ® Umlaut: 
» [laeıft]*: RaAu?, 128.1 Anm. 2: left. © Bornheim, Eckenheim, Sachsen- 
hausen: D [ar]: WS?, 8: gelafe. © Oberrad: D [ar]: WS?, 8: gelafe. 
FR25°%, WS8: gelaafe. — » Rahm. (roum). > [ram]: OPZ?, 1.52.15: 
der Rahm. © Sachsenhausen: > [Raım]”: OPZ?, 1.52.15: der Rähm. — 
» Rauch. (rouch). > [ra:x]”: OPZ?, 1.50.2: Raach. > [ra:x]*: Rau‘, 
126.1: raX. D [ramx]’: RAuK, 58: Rauch, „wieder deutlich das Streben 
zur Verdunklung“. — » Saum. (soum). & [sam]’: OPF?, 1.335: Sam. & 
Umlaut: Säumchen, Dim.: » [seım39/serm39]*: RAu*, 128.1: semso (Dim.). 
RAU“, 128.1 Anm. 1: &, „Nebenform “. © Sachsenhausen: D [sarm]?: OPF?, 
1.335: sache 7“ . ® Umlaut: Säume: » [serm]?: OPF?, 1.335: „sachs. Pl. 
4% 6. » [sermzo]t: Raut, 128.1 Anm. 2: &. — » Traum. (troum). D 
[traım]?: OPF?, 1.335: Tram. OPF°?, 1.222: getraamt (geträumt). OPF°, 
1.225: du traamst (du träumst). & Umlaut: Träume: © [treım]: OPF?, 
1.338: Treem (Pl.). © Sachsenhausen: > [tra:m]?: OPF?, 1.335: „sachs. 
1 a. ® Umlaut: Träume: v [trerm]: OPF?, 1.335: „sachs. Pl. 4“ ©. 
öu > [a]? — [a]? > [oı]* > hd.[sv] 
» Freude, freuen. (vröude, vröuwen). > [fraxt]”: MAB°, 13: Frähd. Sey°: 


Unn kießde unn leckde unn frade sich. TE: Wamm se sich frahe kenne. 
OPF?, 1.147: Fraad. OPZ?, 1.34.5: fra&. > [fra:t, fra:o]®: Rau?, 126.1: 


zn 
(q>) 
— 
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frat, frao. > [frort, frojo]: RAU*, 126 Anm. 1: „froit, Freude, froio, freuen 
[...| haben die ursprünglichen Entwicklungen, die nur hin und wieder noch 
bei alten Leuten gehört werde, fast völlig verdrängt“. — » Streu, streu- 
en. (ströuen). > [ftraw]”: OPZ?, 1.17.8: gestraat (gestreut). > [ftra:, 
Stra:o]?: FRs?: ufder Straa. STL?, 1892, 158: Lääf en nach und strää Salz 
uffen Schwanz. RAU“, 126.1: Stra, Strao. D [Jtror, ftrojo]: Rau“, 126.1 
Anm. 1: Stroi, Stroio. 


2. Monophthongierungs-A vor historischem -N: 


(a)E-N > [a] > had.[aı] 
» allein. (alein). > [la]; MaB°, 13: änzig (einzig). MAB°, 68: allän, 
wie in franz. allin. OPZ?, 1.10.13: amal (einmal). OPF?, 1.105: a(n)fach 
(einfach). OPF?, 1.14.1: a(n). RAU?, 122.1: ola. — » Bein. (bein). > [ba:]: 
MAB°, 68: Bän, wie in franz. Bain. OPF’?, 1.574: Ba(n). Or2?, 1.47.2: Bä(n), 
Bä(n)che, Bänercher. OP2?, 1.53.12: uff die Bä(n) keem. OP2?, 1.20.5: die 
Ba(n). RAU?, 122.1: ba. — » eins. (einez). > [a:nds]: OPZ?, 1.24.1: änich. 
RAU, 122.1: änd$. — » kein. (kein). > [kPä:];: MAB°, 68: kan (sic!), wie 
in franz. quand. OPZ?, 1.15.6: ka. OPF?, 1.132: ka. OPZ?, II.1.1: kans. käns 
(keins). Rau, 122.1: kha. © Sachsenhausen: > [a:]?: OPF?, 1.344: ka. — 
» klein. (klein). > [klar]: OPF?, 1.101: kla. OPZ?, 1.20.6: klane. OP2?, 
1.26.5: Klänigkeit. Rau‘, 122.1: kla. o Umlaut: Keine: » [kle: n&]: OPZ?, 
11.11.6. OPZ2, 11.9.3: kleenem. — » Main. (Moinus). > [mär]: OPZ?, 
1.28.2: in Ma geschisse häwwe, Rau‘, 122, Anm. 1: ma, „infolge Bkcher 
Verschriftdeutschung wurde seit etwa dem 15. Jh. der Diphthong oi (...) 
durch ai ersetzt“. RAUZ?, MW: mä. — » Stein. (stein). » [fdä:]: MAB°, 
68: Stän, wie in franz. Schtin. OPF?, 1.159: Sta(n). RAu?, 151.2: 3da. 
(b)E-N > [er]? + [a]? > had.laı] 

» meinen. (meinen). > [me:na]?: MaB°, 12: du meenst. OPF?, 1.388: 
mer meent. 1.380°: ich deet meenne. > [maina]*: RAu?, 122.1: mäno. 


3. Hyperkorrekturen 


()i > [a [a]? > ha.faı 
» Eisen. (isen). > [aızo/a:z&n]*: Rau, 160.1: aiso. RAu*, 115.5: asän. 
— » Leim. (lim). > [laım]?: OP?, 1.39.8: geleimt. > [larm]*: Raut, 115.5: 
lam. RAUZ°: Laam, Laamsieder. — » streichen. (strichen). > [ftra:39]: 
Rau‘, 115.5: Straso. — » Wein. (win). > [vaı]**: OPF?, 1.315: eb&lwai 
(Apfelwein). Rau?, 115.3: wai. D [var]’: RAUZ?, MW: Eblwäkrands, 
(b)Ü > [au]? + [a]? > hd. [av] 
» brauchen. (brüchen). D [pravyo]”: OP?, II.14.9: brauch. OP?, 1.28.5: 
gepraucht. > [praryo]?: ScHna°: brääche (brauchen). ET*: braacht (er 
braucht). RAU?, 119 Anm. 1: präxo, „mitunter“. RAU25?, 84: präxo, „neu- 
erdings“. — » räumen. (rümen). > [raumo]?: OP?, 1.15.5: raumen. > 
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[ra:ma]*: Rau‘, 119 Anm. 1: ramo, „Allgemein gebräuchlich ist... “. — 
» Raupe. (rüpe). > [raup]?: OP?, 1.47.2: Raupe. > [ra:p]*: Rau“, 119 
Anm. 1: rap, „mitunter“. — » Schlauch. (slüch). > [flaux]”: OP?, 1.42.7: 
Schlauchzwiwwele (Schlotten). & [fla:x]*: RAU*, 119 Anm. 1: slax. 


9.8.3 Die Kontrastgruppe MA im VokalJäger 


Für die in diesem Abschnitt untersuchte Gruppe der im Frankfurterischen gege- 
benenfalls monophthongierenden alten EI, OU und ÖU stellt sich natürlich zuerst 
die Frage, ob überhaupt zu einem langen A-Laut monophthongiert wird oder ob 
der entsprechende hochdeutsche Diphthong Jar], [au] oder [>v] vorliegt. Dazu wur- 
de das Monophthongierungsverhalten der in den Tondokumenten vorkommenden 
Stämme in Tabelle 48 auf S. 366 dokumentiert. Die Auswertung folgt in Abschnitt 
9.8.4 ab S. 369. Unter der Annahme der Monophthongierung stellt sich dann die 
Aufgabe, die Klangfarbe des entstandenen A zu untersuchen. Aufgrund der zu 
erwartenden unterschiedlichen Lautentwicklung vor Nasal werden für das Mono- 
phthongierungs-A zwei Kontrastgruppen gebildet und dann mit den Gruppen des 
kurzen neutralen A, der kurzen und langen O-Laute und der langen dunklen A 
kontrastiert: 


MA Wörter mit Monophthongierungs-A: Das klassische Frankfurterische hat- 
te hier langes neutrales [a:], das Hochdeutsche behält den alten Di- 
phthong. 


MA-N Wörter mit Monophthongierungs-A vor Nasal: Das klassische Frankfur- 
terische hatte hier langes nasaliertes [ar], das Hochdeutsche behält den 
alten Diphthong. 


Im Frankfurterischen ist für das nicht nasalierende Monophthongierungs-A ein lan- 
ger neutraler [a:)-Laut zu erwarten, der mit dem kurzen neutralen [a] bzw. Kon- 
trastgruppe A zusammenfällt. Eine vom zugrundeliegenden alten Diphthong EI 
oder OU abhängige Lautvariation ist für den Frankfurter Stadtdialekt nicht pro- 
gnostiziert: mit dem VOKALJÄGER sollte man also durchgehend ein ( = 4 für den 
Öffnungsgrad der Hinterzungenvokale messen und im Kontrastpaar [MA A] keine 
Differenz, also ein Al = 0, finden. Dies ist insofern bemerkenswert, als dass langes 
A im Frankfurterischen üblicherweise dunkel war: für altlanges A und Dehnungs- 
A erschien regelmäßig langes dunkles [ar]. Somit hatte das Frankfurterische einen 
Kontrast in den langen A-Lauten: Entsprechend sollte man mit dem VOKALJÄGER 
im Kontrastpaar [MAwA] und [MA A: ] jeweils ein AC = 1 bestimmen können. 
Für das Monophthongierungs-A vor Nasalen, insbesondere vor -N, hier Kon- 
trastgruppe MA-N, sieht die Situation anders aus: die Nasalierung bedingt tenden- 
ziell eine Verdunklung'”®. Die Bestimmung des exakten Lautwerts bzw. der Merk- 
malsausprägung NASALIERUNG mit dem Instrumentarium des VOKALJÄGERS ist 


133n Einzelfällen kann auch ein vorangehender Nasal eine Nasalierung des Folgevokals auslösen. 
Zur Untersuchung wird Meister in die Kontrastgruppe MA-N sortiert. 
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aus zweierlei Gründen problematisch: Zum einen ist der VOKALJÄGER auf hoch- 
deutsches Sprachmaterial trainiert, das nicht, zumindest nicht in ausreichender 
Anzahl, über nasalierte Sprachproben verfügt. Zum anderen basiert die hier zum 
Einsatz kommende VOKALJÄGER-Konfiguration einzig auf Formanten — aber ge- 
rade die Nasalierung zeichnet sich durch starke Anti-Formanten aus, die so nicht 
einfach zu erfassen sind. Hier müssten über Formanten hinausgehende akustische 
Größen erwogen werden (vgl. Abschnitt 3.4.4 ab S. 73). So sei C = 3 für [ar] ange- 
setzt, um dem dunklen Charakter des Lauts Rechnung zu tragen. Auf jeden Fall 
aber ist der nasalierte A-Laut im Frankfurterischen unterschiedlich zum neutralen 
[a]. Entsprechend sollte man im VOKALJÄGER bei vorliegender Nasalierung in den 
Kontrastpaaren [MA-N A] bzw. |MA-N MA] ein AG > 0 finden. 

Ein Sprecher bzw. eine Sprachprobe wird als Frankfurterisch markiert, wenn 
vor allem überhaupt eine Monophthongierung festgestellt wird. Des Weiteren soll 
im Kontrastpaar |A MA] kein signifikanter Abstand vorliegen, also AG = 0. Als 
hinreichende Nebenbedingung soll für die Kontrastgruppe MA ein ( > 3,5 gelten, 
also ein tendenziell neutrales A. Dialektalität wird gegebenenfalls nach Marburger 
Konvention für Monophthongierung mit 9 = 3 angesetzt. Hinsichtlich des Mo- 
nophthongierungs-A von Nasal ist Nasalierung das wesentlich Frankfurterische: 
So soll im Kontrastpaar [AMA-N]| ein signifikanter Unterschied von AC > 0,5 
vorliegen. Als Nebenbedingung gelte d < 3,5. Die Dialektalität des nasalierten 
Monophthongierungs-A wird mit 9 = 3 für die Monophthongierung plus der Merk- 
malsdistanz AC aus der Nasalierung angesetzt. Damit wird der Verschiebung aus 
der Lage des neutralen A bzw. ( = 4 durch Nasalierung Rechnung getragen. 

Exemplarische Messwerte des VOKALJÄGERS für die Merkmalswerte ( und die 
Merkmalsdifferenzen AG sind in Tabelle 49 auf S. 368 wiedergegeben. Die vollstän- 
digen Ergebnisse zu ( werden in Abbildung 106 auf S. 370 dokumentiert, wo auch 
die Schwankungsbreiten abgelesen werden können. Die Messungen zu AC finden 
sich in Abbildung 107 auf S. 372. Weitere Zahlenwerte und ein Test auf frankfurte- 
rische Dialektalität hinsichtlich der Kontrastpaare [A MA] und [A MA-N] sind in 
Tabelle 50 auf S.374 gedruckt. Ergänzende Daten zu ACH? liefert Abbildung 149 
auf 5.482 im Anhang. Einzelheiten zum Aufbau der Kontrastgruppen und den (® 
und (’ sind ebenso im Anhang ab Abbildung 132, S. 468f., beigelegt. 
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Al AG 

A MA MA-N A MA MA-N 
kFra & 40 40 3,90 FraLD ( 40 40 25 
A a 4,0 A 4,0 
MA ar 4,0 = MA 4,0 (-)" 
MA-N är 30 10 10 M-N 2,5  15* 1,5* 
A: ai 30.10 10 = Ar 33 7.07% 00) 
Ä a: 3,0 1,0 1,0 - Ä SE gen 1 Ar ran (1-35 
0-rC ) 3,0 1,0 1,0 = 0-rC 3,5. .(0,5)# (0,5)® (1,0)° 
0 o 20. 20: 50. %o 0 5 5, 5 ee 
0: 01 20, 20%. 58: 3E0 0: 3:0., >20 22,0 (0,5) 


Tabelle 49: Exemplarische Merkmalswerte ( und Merkmalsdifferenzen Al für das 
Monophthongierungs-A in Normalposition (MA) und vor Nasalen (MA-N) im Kontrast. 
— kFra: ideelle Referenzwerte eines Sprechers des klassischen Frankfurterischen aus 
Hauptperiode 4 (1900-1925). —Messung mit dem VOKALJÄGER: FraLD: Das Frank- 
furter Lautdenkmal von 1937. Angesetzt wurde das gleitende Merkmal der Öffnungs- 
stufe der Hinterzungenvokale. Eine Untersuchung des Lautwerts des Monophthongie- 
rungs-A im Hochdeutschen findet nicht statt, da dieser Laut im Hochdeutschen nicht 
als Monophthong vorkommt. Für FraLD misst man in der Gruppe MA ein ( = 4,0 
[4,0-4,0], was im Bereich der kurzen neutralen A liegt. Entsprechend kann man mit 
auch mit AC = 0 aus AC® = (0,0)" [0,0-0,0] keinen Unterschied im Kontrastpaar 
[|AMA] messen. In der Gruppe MA-N nasaliert das A allerdings stark und es fin- 
det eine starke Bewegung mit ( = 2,5 [1,9-3,8] vom neutralen A weg statt. Im 
Kontrastpaar [A MA] misst man mit AC = 1,5* [1,5-2,1] einen deutlichen Unter- 
schied (alle Werte in den Tabellen sind mit einer Stelle Genauigkeit wiedergegeben; 
nicht-signifikante originäre AC® sind jeweils in Klammern gesetzt und stehen für ein 
endgültiges AC = 0; das Signifikanzniveau ist hochgestellt; Werte mit Al’ < 0,05 
sind als ‚— gedruckt). 
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9.8.4 Diskussion 


Eine durchgängige Monophthongierung der EI- und OU-Stämme findet sich haupt- 
sächlich in den alten Lautdenkmal-Aufnahmen (vgl. Tabelle 48 auf S. 366). Aller- 
dings ist auch schon im Frankfurter Lautdenkmal keine Monophthongierung mehr 
für altes ÖU zu finden - es erscheint schon die dem Hochdeutschen vokalisch gleiche, 
neuere Form: z.B. nhd. freuen, [frovon], mhd. fröuen, kFra. [frojo]? anstatt altem 
[fra:o]?. Diese Entwicklung wurde von Rauh schon für Hauptperiode 4 (1900-1925) 
beschrieben, wo [a:] für alten ÖU-Laut fast ausgestorben war. 

Für die Neu-Frankfurter Sprecher ist der Durchdringungsgrad der Monophthon- 
gierung unterschiedlich. Für manche Stämme wie z.B. nhd. Frau, mhd. vrouwe, 
kFra. [fra:] oder nhd. auch, mhd. ouch, kFra. [a:x] erscheint sie fast durchgehend. 
In nhd. Kleid, mhd. kleit, kFra. [kla:t] oder nhd. Seife, mhd. seif, kFra. [sa:f] hin- 
gegen wird sie seltener verwendet und manchmal auch nur auf Nachfragen des 
REDE-Explorators. Von den Neu-Frankfurter Sprechern hat FraFA1L den höchs- 
ten Grad der Monophthongierung — obwohl er auch hyperkorrektes [va:s] aus nhd. 
weiß, mhd. wiz, bildet - und FraF2L den geringsten. 

Was den Lautwert betrifft, findet man ( = 4 für alle Sprecher, so denn nicht- 
nasalierte Monophthongierung auftritt. Entsprechend misst man auch keine si- 
gnifikanten AG > 0 im Kontrastpaar [MA»A]. Für das Frankfurter Lautdenkmal 
findet man ein ( = 4,0 [4,0-4,0] und ein AC = 0 aus AC® = (0,0)"° [0,0-0,0]. Für die 
Sprecher, die überhaupt noch langes verdunkeltes A aufweisen, zeigt sich ein signi- 
fikanter Unterschied zwischen diesem Laut und dem Monophthongierungs-A - für 
das Frankfurter Lautdenkmal findet man ein AC = 0,7** [0,7-0,7| im Kontrastpaar 
[MAwAz |. Es erscheint, dass kein qualitativer Unterschied zwischen Monophthon- 
gierungs-A aus EI und OU vorliegt, doch ist die Teilgruppe der nicht nasalierenden 
EI zu klein und zu wenig durchgehend befüllt, um belastbare Messungen machen zu 
können. All dieses Verhalten entspricht der Erwartung. Allerdings findet sich kein 
Beleg für die von Rauh (1921b, 58) und Broxten (1985, 43) beobachtete Verdunk- 
lung des Monophthongierungs-A in Normalposition in der Spätphase des Stadtdia- 
lekts — hier müssen weitere Messungen Aufschluss geben. Damit kann man vorerst 
schließen, dass das lange Monophthongierungs-A der Tonaufnahmen ein neutraler 
[a:]-Laut ist, der qualitativ nicht signifikant unterschiedlich zum kurzen neutralen 
[a] ist, wohl aber signifikant getrennt vom langen dunklen [ar], so es denn auftritt. 

Hinsichtlich des Monophthongierungs-A vor Nasal (Kontrastgruppe MA-N) er- 
gibt sich in den Lautdenkmal-Aufnahmen und bei FraFAlL ein deutlich von der 
Gruppe MA abweichender (-Wert: Für das Frankfurter Lautdenkmal ist ( = 2,5 
[1,9-3,8], was tendenziell im Bereich der O-Laute bzw. des Dehnungs-A und des 
altlangen Ä liegt. Die anderen Lautdenkmalsprecher als auch FraFAlL weisen ähn- 
liche Muster auf: Im Kontrastpaar |MA-N A| und |MA-N MA] werden signifikan- 
te Unterschiede gemessen: für FraLD ergibt sich in beiden Fällen ein Ad = 1,5* 
[1,5-2,1]. Auch fällt MA-N mit Ar zusammen — es werden für FraLD mit Al = 0 
aus AC® = (0,9)": [0,9-1,5] keine belastbaren Differenzen bestimmt. Vom (-Wert 
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Öffnungsstufe Monophthongierungs-A 
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Abbildung 106: Das Monophthongierungs-A (MA; vor Nasal: MA-N) im VOKAL- 
JÄGER. Verteilung des gleitenden Merkmals der Öffnungsstufe der Hinterzungenvo- 
kale ( für verschiedene Sprecher. Anordnung in Gruppen von links nach rechts: LD: 
Lautdenkmal; HD: Hochdeutsch in Auswahl und Mittel; NF: Neu-Frankfurterisch, 
insbesondere REDE. Das Symbol und der unten gedruckte Wert zeigen den Medi- 
an an, also C; der vertikale Strich den C-Interquartilbereich zwischen dem 25%- und 
75%-Perzentil. Das obere Zahlenpaar protokolliert die Probenzahl n und Zahl der 
Stämme w, getrennt mit ‚/‘. Für alle Dialektsprecher in MA liegt ( auf dem Wert des 
hochdeutschen A-Lauts (beachte: für die hochdeutschen Sprecher gibt es keine Laut- 
proben). In der Gruppe MA-N, also vor Nasalen, erfolgt eine deutliche Verschiebung 
zu verdunkelten Lauten, falls Nasalierung auftritt. Für das Frankfurter Lautdenk- 
mal (FraLD) misst man in Normalposition, Gruppe MA, ein ( = 4,0 [4,0-4,0] und mit 
Nasalierung, Gruppe MA-A, ein C = 2,5 [1,93,8] . 
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her liegt es nahe, den Laut der Kontrastgruppe MA-N als ‚verdunkelt‘ bzw. O- 
ähnlich zu bezeichnen, doch gelten hier die Anmerkungen zu den Einschränkun- 
gen des VOKALJÄGERS zu nasalierten Lauten. Somit kann man vermerken, dass 
der VOKALJÄGER zwar wegen der beschriebenen Einschränkungen Nasalierung 
nicht direkt messen kann — wohl aber kann er die durch Nasalierung auftreten- 
de C-Änderung erfassen und daraus indirekt die Nasalierung erschließen. Dieses 
‚verdunkelte‘ nasalierte Monophthongierungs-A tritt nicht bei allen Sprechern auf. 
Für viele Neu-Frankfurter Sprecher ist der Laut von EI vor Nasal bzw. der Grup- 
pe MA-N nicht unterschiedlich zum Monophthongierungs-A bzw. neutralen A der 
Gruppen MA und A. Verdunklung und „die Tendenz zur nasalen Aussprache“ fand 
für nasaliertes Monophthongierungs-A auch Broxten (1985, 43), allerdings nur für 
ältere Sprecher, hier Hauptperiode 6. Bei jüngeren und mittelalten Sprechern des 
Neu-Frankfurterischen, das ist Hauptperiode 7, fehlte die Nasalierung schon in den 
frühen 1980er-Jahren. Das deckt sich mit dem Befund des VOKALJÄGERS für die 
jüngeren REDE-Aufnahmen. 
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Intra-Sprecher-Distanzen: Öffnungsstufe Monophthongierungs-A 


MA-A cos 
1- .4 
e2 
@3 
2- @®4 
Se Signifikanz 
3 nr 
A* 
ols 
4-/++® ne 
ooo 
ooo 
14 
a_.„zen 
SOOSSL 
LENNY 


Abbildung 107: Merkmalsdistanz Al zwischen dem Monophthongierungs- A 
(MA) als Referenz und den kurzen A-Lauten (A) und dem Dehnungs-A (Ar) desselben 
Sprechers als Vergleich (Symbol: Merkmalswert ( der Referenz; vertikaler Strich und 
Zahl: originäre Differenz AC® bezüglich des gleitenden Merkmals der Öffnungsstufe 
der Hinterzungenvokale; das andere Ende des Strichs zeigt mit dem Symbol ‚— das ( 
des Vergleichslauts an). Referenz- und Vergleichslaut gelten als unterschiedlich, falls 
die Distanz AC® signifikant ist (**: hoch signifikant; x: signifikant; ‚Is zu geringe 
Probenzahl; ‚th‘: Minimaldistanz nicht erreicht: ‚ns‘: nicht signifikant). Der COS 
Parameter misst das Nicht-Überlappen der Verteilungen (hier: 1, stark überlappend, 
bis 4, weitgehend getrennt). Monophthongierungs-A und kurzer A-Laut fallen immer 
zusammen: die Unterschiede sind nicht signifikant. Wohl aber unterscheiden sich 
Monophthongierungs-A und Dehnungs-A bei den Sprechern, die letzteres verdunkeln: 
Damit existieren hier zwei lange A-Laute mit deutlich unterschiedlicher Klangfarbe. 
Im Frankfurter Lautdenkmal (FraLD) kann man mit AC = 0 aus AC® = (0,0)" [0,0- 
0,0] keinen Unterschied im Kontrastpaar [MA A] messen, wohl aber mit Al = 0,7** 
[0,7-0,7] einen signifikanten Unterschied im Paar [MA»A:]. 
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Intra-Sprecher-Distanzen: Öffnungsstufe Monophthongierungs-A 
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Abbildung 108: Merkmalsdistanz Al zwischen dem Monophthongierungs- A 
vor Nasalen (MA-N) als Referenz und den A- und O-Lauten sowie dem Monophthon- 
gierungs-A in Normalposition (A, Ar, MA und Or) desselben Sprechers als Vergleich 
(Symbol: Merkmalswert ( der Referenz; vertikaler Strich und Zahl: originäre Diffe- 
renz A(® bezüglich des gleitenden Merkmals der Öffnungsstufe der Hinterzungenvo- 
kale; das andere Ende des Strichs zeigt mit dem Symbol ‚-‘ das ( des Vergleichslauts 
an). Referenz- und Vergleichslaut gelten als unterschiedlich, falls die Distanz AC 
signifikant ist (**: hoch signifikant; x: signifikant; ‚Is‘: zu geringe Probenzahl; ‚th‘: 
Minimaldistanz nicht erreicht: ‚ns‘: nicht signifikant). Der COS Parameter misst das 
Nicht-Überlappen der Verteilungen (hier: 1, stark überlappend, bis 4, weitgehend 
getrennt). Monophthongierungs-A vor Nasal (MA-N), wo es dunkel bzw. nasaliert ge- 
sprochen wird, unterscheidet sich signifikant vom kurzen neutralen A (A). Im Frank- 
furter Lautdenkmal (FraLD) misst man einen deutlichen Unterschied von AC = 1,5* 
[1,5-2,1] im Kontrastpaar [MA-N MA]. 
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A MA 
Sprechkee COS nı wı GG m uw (a Alt an Al © 
FraLD — 178 40 5 3 4,0 - m - 30 x 
KG1 Di 2 a en A ee en 
KG2 a dt ee 3 
FaflL 02 % 2 39179 0 01 ms - 30 
FraF4L 04 14 11 40 5 4 4,0 u ns - 30 x 
FraFAIL 05 17 11 40 2 1 4,0 = ns - 30 x 
FraFA2aL 05 12 8 40 1 1 4,0 = Is - 30 x 
FraFJ1 02 11 11 40 3 3 4,0 = ns - 30 x 
FraLC = 9 740 6 6 4,0 - m - 30 x 
A MA-N 
FraLD 06 178 AO 16 7 2,5 1,5 * 15 45 x 
KG1 06 24 13 40 4 2 3,0 10 ns - 390 
KG2 07 4A 340 5 3 27 13 * 13 43 x 
Map. 0 94 1.383. 1.5 20707 ea 
FraF3L 02 26 12 39 73 40 01 ms - 390 
FraF4L 04 14 11 40 2 1 4,0 = Is - 30 
FraFAIL 04 7 1 a0 5 3 30 10 ms - 30 
FraFAaL 08 2 8 a0 1 1 37 08 B - 30 
FraLC - 9 740 A 4 4,0 - m - 30 


Tabelle 50: Beurteilung der Dialektalität des Monophthongierungs-A anhand 
der Merkmalsdistanz AC® des Monophthongierungs-A (MA) und des kurzen A-Lauts 
(A). Ein für die Frankfurter Stadtmundart typisches, signifikantes und dialektales 
Muster bzw. eine binäre Dialektalität wird mit x markiert (Hauptbedingung AC < 
0,25; Nebenbedingung (a > 3,5;). 9 misst hier die Monophthongierung per se, die 
nach Marburger Konvention mit pauschal 3 angesetzt werden soll. Signifikanzen «a: 
»x: hoch signifikant; x: signifikant; ‚Is: zu geringe Probenzahl; ‚th‘: Minimaldistanz 
nicht erreicht: ‚ns‘: nicht signifikant. COS: Bhattacharyya-Distanz als Maß für die 
Trennung der Verteilungen, — 1: getrennt; n: Probenzahl; w: Zahl der Stämme. 
Für Werte < 0,05 steht ‚—. Für alle Dialektsprecher fallen Monophthongierungs-A 
und kurzes A zusammen: die Unterschiede sind nicht signifikant. Wohl aber gibt es 
deutliche Unterschiede beim Monophthongierungs-A vor Nasal (MA-N), wo es dunkel 
oder nasaliert gesprochen wird. Dies ist an Werten von C = 3 zu erkennen (auf 
ein d = 3 wird hier gegebenenfalls das Al der Kontrastgruppe [A MA-N] addiert; 
Hauptbedingung A( > 0,5; Nebenbedingung (a < 3,5). 
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0 1 2 3 4 B) 
1700 1825 1850 1875 1900 1925 
mhd. Hauptperiode 1825 1850 1875 1900 1925 19455 HD 


alt, Frankfurt a a a ) ar/ar al a 
kalt, (Mundart) a: a a ah/aa ah/aa ah/jaa 
bald (Oppel) ä 
(Wülcker) ao 
(Rauh) a/ä 
 Vororte Auen 7 N ee REDEN 
(Mundart) ahfaa aha ahfaa 
A-LT Frankfurt a a a a a a a 
(Mundart) ar 
(Oppel) a 
(Rauh) 
Vorort —— 
(Mundart) 


Übersicht: Die wichtigsten Lautentwicklungen für das A vor -LT im Frankfur- 
terischen, wie sie sich aus den Schriftbelegen ergeben (obere Zeile: erschlossene 
IPA Lautwerte; untere Zeilen: originale Lautzeichen der Quellen; HD: Hoch- 
deutsch). Die Wörter alt, kalt und bald sind gesondert aufgeführt. Hier änderte 
sich der Lautwert von einem neutralen [a]? über ein dunkles [a:]? hin zu einem 
neutralen [ar]. 


9.9.1 Klassisches Frankfurterisch 


Überaus interessant ist die Entwicklung von altkurzem A vor -LT, wie z.B. in den 
Wörtern alt, bald, Falte, kalt, Wald, Salz usw. Das Hochdeutsche hat hier durch- 
gehend kurzes neutrales [a], genauso wie auch die meisten Wörter des Frankfurte- 
rischen, z.B. nhd. Wald, [valt], mhd. valt, kFra. [valt]. Das war in den Umgebungs- 
dialekten nicht der Fall, was der Deutsche Sprachatlas als auch die Landschafts- 
grammatiken der Umgebung zeigen (Siemon [1921], Urff [1926, 5], Born [1938, 
50 £.|, Schnellbacher [1963, 377], SHWB [1965-1968] und HNWB [1911 £.]). Im zen- 
tralhessischen Norden — und damit in den Frankfurter Vororten — sowie im Osten 
überwogen mundartlich Formen mit langem neutralen [ar], in Südhessen mit kurz- 
em dunklen [a] und im rheinfränkischen Westen als auch weiter östlich mit kurzem 
neutralem [a]. Wald erschien also im Norden als [va:lt], im Süden als [valt] und im 
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Westen sowie weiter östlich als [valt]. Die Grenzen sind zeitlich nicht konstant. In 
2.B. Salz verschob sich die Grenze zwischen der südlichen Form mit kurzem hellen 
A, [salds], und der nördlichen mit langem A, [sa:lds], deutlich zwischen 1880 und 
1960. Der Deutsche Sprachatlas zeigt den Beginn des [a:]-Gebiets noch knapp über 
Bockenheim. Der abschließende Verschlusslaut -T wurde im Süden und Westen er- 
halten. In der Wetterau fiel T z.B. in alt ab, was dann zu Ja:l] wurde — ebenso in 
Langenselbold, Offenbach und im Süden bis knapp unter Frankfurt: Auch Drei- 
eich hatte [a:l]. Im Taunus erschien [ald]. Die Abbildung 109 auf S. 377 gibt einen 
Überblick über die Formenvielfalt rund um Frankfurt. 

Wie schon oben erwähnt, war die Regelform im klassischen Frankfurterisch 
der Hauptperiode 4 (1900-1925) kurzes neutrales A bei erhaltenem Verschluss 
und damit unterschiedlich zu den Umgebungsdialekten. Doch das galt nicht für 
die Wörter alt, bald und kalt, die in Frankfurt um 1920 ein langes A hatten und 
keinen Verschluss. Interessant ist: Während das Frankfurterische sich üblicherwei- 
se in Richtung des Hochdeutschen bewegte, beobachtet man hier die umgekehrte 
Bewegung - die dem Hochdeutschen gleichen ursprünglichen Frankfurter Vokale 
wurden durch dem Hochdeutschen fremde ersetzt. Oppel hörte fast durchweg in 
diesen Wörtern in Hauptperiode 2 (1850-1875) die Aussprache [alt, balt, k"alt], 
gleich der hochdeutschen Lautung. Es findet sich aber auch schon ein Beleg mit 
langem A in einer Redeweisheit, die er zitiert: „Ahl Holz unn ahle Wei(n) iß gut: — 
nor ahl Flaasch iß nix nutz! sage die Judde“ (OP:1.13.1). Rauh notierte in Periode 
4 [al] und [kPaıl] für alt bzw. kalt und Wülcker für Periode 3 (1875-1900) die For- 
men [5:1] und [b>:l] für alt bzw. bald. Damit war das Frankfurter A an dieser Stelle 
im 20. Jahrhundert gleich dem dunklen Dehnungs-A geworden, also [a:]. Zusätzlich 
merkt Rauh aber an, dass daneben „auch“ ein [a:l] und [kPa:l] mit langem neu- 
tralen [a:] existierte, also qualitativ gleich dem Monophthongierungs-A (RAu: 90.3 
Anm. 4). Vermutlich deutete sich hier schon eine Entwicklung zu einem langen A 
mit neutralem Klang an. In Rauhs Fragebogensammlung findet sich 1940 die An- 
merkung zu kalt: „kahl mit reinem a gesprochen, nicht verdunkelt“. Zu Wülckers 
Zeit schien das A noch dunkel gewesen zu sein. 

Was war hier passiert? Offensichtlich ist eine dem Hochdeutschen gleiche alt- 
frankfurterische Form von einer zentralhessischen Dialektform etwa in Hauptpe- 
riode 3 (1875-1900) ersetzt worden. Unter alt druckt das FWB: „Die Frankfur- 
ter Form ald scheint im Laufe des 19. Jahrhunderts von der oberhessischen und 
sachsenhäuserischen Form äl verdrängt worden zu sein“, was vermutlich eine An- 
merkung von Rauh ist. Doch warum? Es erscheint, dass hier eine Art dialektaler 
Hyperkorrektur vorliegt: In Hauptperiode 2 (1825-1850) setzte die Bevölkerungs- 
explosion von Frankfurt ein. Neu Hinzugezogene erlernten den Dialekt, suchten 
Dialekt zu sprechen und übernahmen aus dem Sachsenhäuserischen die deutlich 
lautmalerischere und dialektalere Form als vermeintlich Frankfurterisch. 

Da die Dialektform in der Schreibung eindeutig markiert werden kann, etwa 
mit (ahl) oder (aal) gegenüber (alt), kann auch Mundartliteratur, unter anderem 
aus der Belegsammlung des FWB, herangezogen werden: Sowohl Textor (1794), 
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Abbildung 109: A vor -LT in alt, bald, Falte, kalt, Salz und Wald um Frankfurt 
nach dem Deutschen Sprachatlas und den Landschaftsgrammatiken (eigene Skizze; 
Lautzeichen in Teuthonista: (ä) ist [o/a], (d) ist [d/t]). 
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Malß (1821) und Friedrich Stoltze (1870) schrieben immer dem Hochdeutschen 
gleich (bald), (alt), (kalt) - aber etwa (Kasinobahl) für den Tanzball. Breimund 
hatte 1821 für Sachsenhausen (ahler) für alter. Die ältesten Belege für gedehnte 
und verschlussfreie Formen sind jüngeren Datums, etwa (ahler), alter bei Adolf 
Stoltze (1885), (baal) für bald in Friedrich (1854; vermutlich aber Zentralhessisch, 
da aus Rödelheim), sonst (baalvoll) für baldvoll bei Hameran (1900) oder (kalle) 
für kalte in Bohn (1882)'%. 


9.9.2 Ausgewählte Schriftbelege 


1. Die Wörter alt, kalt und bald: 


AI > [a]? + [2]? + [ar/ar]? < [a]? > hd.[a] 

> alt. (alt). > [alt]*: Te: alter. MAB°: alte. Sau!: Alte. OPF?, 1.19.2: alt: 
ä. OPF?, 1.574: die alt Frä. OPF?, 1.324: die Alde. OPF?, 1.243: der Alt. WS?: 
alte. > [o:l]?: WÜF?, 29: aol. > [a:l/a:l]*: RAU, 90.3 Anm. 4: äl. RAu?, 90.3 
Anm. 4: äl, „spricht die Mundart auch“. > [al]: RAu27°: Ahle Mark. ahl 
Quetsch. RAuFB°: aal Supp. © Umlaut: das Alter: » [e]: OP2?, 1.11.10: ält. 
© Umlaut (altes E): älter (elter): » [eld&]: Rau‘, 97.1: eldä. © Bornheim: 
D [aıll?: WS?, 4: ale. © Eckenheim: D [a:l]?: WS?: ahle. © Oberrad: > 
[a:l]®*: WS, 4: alte. FR25°*, WS4: aale. © Sachsenhausen: > J[aıl]: Br°: 
ahler, aaler. WS?, 4: ale. — » bald. (balde). > [balt]?: OPF?, 1.19.2: bald: 
a. OPF?, 1.332: bäld. OP2?, 11.27.9: die häwwese bald all ausgerott. > [barl]?: 
WÜF°: paol. HAKE?: baalvoll, baalfertich. WS®: bald. > [ba:l]’: RauHz?: 
der beikt sich baal die Ohrn ab. © Sachsenhausen: > [ball]: WS, 3: bald. 
© Bornheim: D [ba:l]?: WS®, 3: baal. © Eckenheim: > [barl]?: WS?, 3: 
bahl. © Oberrad: D [ba:l]*!: WS?, 3: bald. FR25%*: baal. © Rödelheim: 
> [baı]?: Fri: di Uniform hällt baal funfzig Johr mich worm. — » kalt. 
(kalt). > [kPalt]?: Br°: Kaltlochgaß. MAB°: kalt. OPF?, 1.569: bis die Brieh 
kalt ik. WS?: kalte. STA®: kalt. > [kPa:l/kParl]*: BoH?: kalle. Raut, 90.3 
Anm. 4: khäl. RAU“, 90.3 Anm. 4: khaäl, „spricht die Mundart auch“. > [kta:l]°: 
RAUFB®: kaale. © Sachsenhausen: D [karl]; WS?, 4: kale. © Bornheim: > 
[ktal:]t: WS?, 4: kale. Her!: kahl. © Eckenheim: > [k"aıl]?: WS?: kahlt. © 
Oberrad: D [kta:l]>*: WS?, 4: kalte. FR25°*, WS4: kaale. 


2. Andere A vor LT: 


Alt > [a? > ha.fa] 

> halten. (halte). > [halds]: MAB°: gehalte. OPF?, 1.19.2: halte: &. OPZ?, 
1.36.4: ich hält. Rau?, 219.e: haldn (halt ihn!). RAUFB°: halde. & Umlaut 
(altes E): » [heldst];: OPZ?, 1.36.4: du hälst, er hält. RAU, 97.1: heldst. © 
Bornheim: > [a:]*: Her‘: haalt Bauer, dej Kouh brunnst. © Bockenheim: > 


[a:]?: RAuZ?: „halle für gehalten von H. Ludwig, 75 Jahre, gehört “. — » Salz. 


134 Alle Belege aus dem FWB. Vgl. dort zu den Textquellen. 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


A vor historischem L und T 379 


alt kalt 

[alt] [al] [Kalt] [Kran] 
FraF2L = = 
Fall () oo 0 4 
FraF4L = = 
FraFA1L 3 4 
FraFA2L - = 
FraFJ1 = = 
FraLC fe) = 


Tabelle 51: Aussprachevarianten in alt und kalt im REDE-Material (im Frankfurter 
Lautdenkmal kommen diese Worte nicht vor). Die dialektale Form ohne Verschluss 
und mit Dehnung ist mit o bzw. f markiert, die nicht dialektale mit ‚—. Klammern 
zeigen einen sekundären Gebrauch an. 


(salz). & [salds]: OPF?, 1.19.2: Salz: &. Rau‘, 165.1: salds. © Oberrad: > 
[a:]>*: FR25°%: Salz. — » Wald. (walt). > [valt]: OP?: den Wald vor lauter 
Beem nätt seh(n). RAU*, 90.1: walt. © Umlaut: Wäldchen: » [vel3o]: OPZ2, 
1.40.14: Wäldche. RAU25%, 72: weise. 


9.9.3 Die Kontrastgruppe A-1t im VokalJäger 


Untersucht werden sollen die kurzen A vor der Konsonantengruppe -LT und es 
wird eine entsprechende Wortgruppe gebildet: 


A-1t Wörter mit A vor -LT hatten in der Regel im Frankfurterischen, dem 
Hochdeutschen gleich, kurzes neutrales [a]?. In den Wörtern alt, kalt und 
bald trat später langes dunkles [ar]? neben langem neutralen [a:]* auf. 


Es sind mit dem VOKALJÄGER zwei Fragestellungen zu untersuchen: zum ersten, 
ob in den Lautproben das kurze A erhalten blieb und wenn ja, in welchen Wörtern 
oder aber, ob es sich zu einem langen A dehnte, gegebenenfalls mit Auflösung des 
Verschlusses. In den vorliegenden Aufnahmen sind die einzigen Wörter, die, wenn 
überhaupt, gedehntes A und keinen Verschluss mehr haben, alt und kalt - in allen 
anderen, wie z.B. halten oder Salz, aber auch bald, bleiben das kurze A und T 
immer erhalten. Tabelle 51 auf S. 379 dokumentiert die Auszählung. 

Die zweite Frage ist die nach dem Klang des A in diesen Konstellationen, ins- 
besondere in der gedehnten Form ohne Verschluss: ist das lange A hier noch ver- 
dunkelt zu [a:] oder schon neutral, also [a:]? Das kurz gebliebene A sollte neutral 
sein, obwohl einen Beeinflussung durch die Nachbarschaft des Laterals vorliegen 
kann (Kohler 1995, 164). Getestet soll werden, ob in der Kontrastgruppe A-1t 
eine Verdunklung bzw. eine klangliche Abweichung von den neutralen A-Gruppen 
stattfindet. Misst man ein C = 4 auf der Skala der Öffnungsstufe der Hinterzun- 
genvokale oder ein ( % 3, was für eine Verdunklung spricht? 
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Das Vorgehen ist für die Wortgruppe A-1t anders als bisher: Da die Population 
extrem dünn ist und im Frankfurter Lautdenkmal weder alt noch kalt vorkommen, 
wurden alle A vor -LT, gleich ob in der Untergruppe mit oder in der Untergruppe 
ohne Verschlussauflösung bzw. Dehnung in einer Gruppe, eben A-1t, zusammenge- 
legt. Es wird also allgemeiner auf eine Lautverschiebung der Gruppe A-1t geprüft. 

Ein Sprecher bzw. eine Sprachprobe wird als Frankfurterisch markiert, wenn 
vor allem in den Kontrastpaaren |A-It A] ein signifikanter Abstand mit AC > 
0,5 gemessen wird. Als hinreichende Nebenbedingung soll für die Kontrastgruppe 
A-1t ein( <3,5 gelten, also ein tendenziell dunkleres A. Diese Suche nach einem 
verdunkelten [a] gilt eigentlich nur für alt und kalt, doch diese Einschränkung ist, 
unter Vorwegnahme der Ergebnisse, irrelevant. 

Exemplarische Messwerte des VOKALJÄGERS für die Merkmalswerte ( und die 
Merkmalsdifferenzen AG sind in Tabelle 52 auf S. 382 wiedergegeben. Die vollstän- 
digen Ergebnisse zu ( werden in Abbildung 110 auf S.381 dokumentiert, wo auch 
die Schwankungsbreiten abgelesen werden können. Die Messungen zu AC finden 
sich in Abbildung 111 auf S.383. Weitere Zahlenwerte und ein Test auf frankfur- 
terische Dialektalität hinsichtlich des Kontrastpaars [A A-1t]| sind in Tabelle 53 
auf $.384 gedruckt. Ergänzende Daten zu AC"P liefert Abbildung 150 auf $.483 
im Anhang. Einzelheiten zum Aufbau der Kontrastgruppen und den ( und (! sind 
ebenso im Anhang ab Abbildung 134, S. 470f., beigelegt. 


9.9.4 Diskussion 


Im Neu-Frankfurterischen der Tondokumente ist die dialektale Form für alt und 
kalt tendenziell ohne Verschluss und mit langem A, aber bei weitem nicht durch- 
gehend (vgl. Tabelle 51 auf $.379). Das Wort bald, was einst denselben Lautstand 
hatte, erscheint immer mit Verschluss und kurzem A, gleich allen anderen Wörtern 
der Gruppe A-1t, wie etwa Salz. Die Klangfarbe aller Wörter in der Gruppe A-1lt, 
gleich ob mit oder ohne Verschluss, ist die eines neutralen A bzw. es gilt C 4 
und es sind keine signifikanten Unterschiede in dem Kontrastpaar [A-It A] zu 
messen. Für das Frankfurter Lautdenkmal (FraLD) misst man ein ( = 4,0 [4,0-4,0] 
bzw. ein AC = 0 aus AC’ = (0,0)" [0,0-0,0]. Folglich kann man schließen, dass die 
Neu-Frankfurter Aussprache für alt [al] und für kalt [k®a:l] ist, mit jeweils lan- 
gem neutralen A. Von einem einstmals an dieser Stelle wohl vorhandenen langen 
dunklen [ar] ist keine Spur mehr zu finden. Alle anderen Wörter in der Kontrast- 
gruppe haben kurzes neutrales A. Das lange A und das kurze A in der Wortgruppe 
A-1t sind hinsichtlich C ununterscheidbar (vgl. hierzu gegebenenfalls die Einzel- 
ergebnisse in Abbildung 134 auf $.470 im Anhang). Im Frankfurter Lautdenkmal 
kommen leider weder alt noch kalt vor und so lässt sich der Lautstand der Haupt- 
periode 5 nicht überprüfen, obwohl nach Rauh hier wohl auch schon [a:] gegolten 
haben kann. 
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Öffnungsstufe A vor [-It] 


‚. AHlt 
2- Gruppe 
GR X HD 
HLD 
35 ANF 
. x 
I sr 
a-m ä 
o m» 
x [se 
[a4 x X =a 
- 27125 
ja} Ss Ne. OS nn y {<< 
ag 223538 SUL LU 
S[OO SS SS DO SSS SS COS OD 
LEN ZEILE TEL U U 


Abbildung 110: Das A vor -LT (A-1t) im VOKALJÄGER. Verteilung des gleiten- 
den Merkmals der Öffnungsstufe der Hinterzungenvokale ( für verschiedene Sprecher. 
Anordnung in Gruppen von links nach rechts: LD: Lautdenkmal; HD: Hochdeutsch 
in Auswahl und Mittel; NF: Neu-Frankfurterisch, insbesondere REDE. Das Symbol 
und der unten gedruckte Wert zeigen den Median an, also (; der vertikale Strich den 
G-Interquartilbereich zwischen dem 25%- und 75%-Perzentil. Das obere Zahlenpaar 
protokolliert die Probenzahl n und Zahl der Stämme w, getrennt mit ‚/‘. Für die 
meisten Dialektsprecher in A-1t liegt ( auf dem Wert des hochdeutschen A-Lauts. 
Auch für das Frankfurter Lautdenkmal (FraLD) misst man ein C = 4,0 [4,0-4,0]. 


Aber die wesentliche Erkenntnis ist, dass die langen Formen ohne Verschluss 
für alt, kalt und bald des Frankfurterischen in Hauptperiode 3 (1875-1900) und 
später kein Ur-Frankfurterisch sind. Der ursprüngliche Frankfurter, wie ihn Oppel, 
Malß und andere in Hauptperiode 2 (1850-1875) und davor hörten, sprach, dem 
Hochdeutschen gleich, Formen mit Verschluss und kurzem neutralen A. 
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AG ANE 
A M  A-lt A M  A-lt 
kFra e 40 40 30 FraFAlL( 40 40 3,7 
\ a 4,0 \ 4,0 
MA aı 4,0 - MA 4,0. „(= ju8 
A-1t ai 30 10 190 A-1t 3,7 (0,3)"5 (0,3)! 
A: ai 30.10 10 - Ar 3:0. 1,0%: 20° 207° 
0: o 20, 20 20, %0 : 3.0» 2909 720° L7* 
AG AG 
\ M  A-lt A M  A-lt 
HD @ 4,0 4,0 FraFJ1 C 40 40 40 
\ a 4,0 \ 4,0 
MA MA 40. a 
A-1t a 4,0 z A-1t 4,0 (-)” (-)” 
Ar a 4,0 > = A: 3:8: 10.2) 410,27. 10,2)°° 
0 ) 30 10 0 0 30°. 10° 20° LO 


Tabelle 52: Exemplarische Merkmalswerte ( und Merkmalsdifferenzen A( für das 
A vor -LT (Gruppe A-1t) im Kontrast. —kFra: ideelle Referenzwerte eines Spre- 
chers des klassischen Frankfurterischen aus Hauptperiode 4 (1900-1925); HD: ent- 
sprechende Aussprache im Hochdeutschen. —Messungen mit dem VOKALJÄGER: 
FraFAIlL: Älterer neu-Frankfurter Sprecher, der hier das Frankfurter Lautdenkmal 
ersetzt; FraF J1: Sprecher des Neu-Frankfurterischen, hier mit nahezu hochdeutschem 
Lautmuster. Angesetzt wurde das gleitende Merkmal der Öffnungsstufe der Hinter- 
zungenvokale. Die für das klassische Frankfurterische tabellierten Werte beziehen 
sich auf die Wörter alt, bald und kalt unter Annahme einer verdunkelnden Dehnung 
(für das Frankfurter Lautdenkmal liegen dafür allerdings keine Proben vor). Das 
Hochdeutsche hat für alle A vor -LT kurzes neutrales A (die Einträge unter MA für 
das Monophthongierungs-A bleiben im Hochdeutschen leer, da dieser Laut dort nicht 
vorkommt). Gemessen wurde über alle Vokale vor -LT. Für FraFAlL ergibt sich mit 
C = 3,7 [3,5-3,9] ein Wert, der im Bereich des neutralen A liegt. Entsprechend misst 
man auch im Kontrastpaar [A A-1t] mit Ad = 0 aus Al? = (0,3)"$ [0,3-0,5] kei- 
nen signifikanten Unterschied. Der Lautwert des A ist nicht verdunkelt. Dies gilt 
sowohl für die Wörter alt und kalt, die bei FraFA1lL dehnen, den Verschluss auflösen 
und wo im klassischen Frankfurterischen eine Verdunklung erwartet wird, als auch 
alle anderen A vor -LT, wo neutrales A prognostiziert wird (alle Werte in den Ta- 
bellen sind mit einer Stelle Genauigkeit wiedergegeben; nicht-signifikante originäre 
AC® sind jeweils in Klammern gesetzt und stehen für ein endgültiges AC = 0; das 
Signifikanzniveau ist hochgestellt; Werte mit AC® < 0,05 sind als ‚—“ gedruckt). 
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Intra-Sprecher-Distanzen: Öffnungsstufe A vor [-It] 


A-t- A 


aFrAlL- 0,3 + 


araaL{0,1 H 


De Se Se a A 


H 
F 
F 
F 
F 
F 
F 
F 


ra le 
m 
oo 
X co =8 X a 4428 
Ba GAB DE 2 > 
a suuss OSSAHFr<A< [m} suuss OSNSNAFr<< 
EN EN SELL iıı Ieweo No SELL iii 
EOVOSCOS SS aD I IST ISO OO EOS 5 DI ISIS SS CS 
LNXYNXNXNNXNNXNYYXYTZLLULLL I I IL LXNXNXNXNXXNXYXYXYZILLLLULLL 


Abbildung 111: Merkmalsdistanz Al zwischen dem A vor -LT (A-1t) als Referenz 
und den kurzen A-Lauten und den A- und O-Lauten (A, Ar, MA und 0) desselben 
Sprechers als Vergleich (Symbol: Merkmalswert ( der Referenz; vertikaler Strich und 
Zahl: originäre Differenz AC bezüglich des gleitenden Merkmals der Öffnungsstufe 
der Hinterzungenvokale; das andere Ende des Strichs zeigt mit dem Symbol ‚-“ das C 
des Vergleichslauts an). Referenz- und Vergleichslaut gelten als unterschiedlich, falls 
die Distanz AC® signifikant ist (**: hoch signifikant; x: signifikant; ‚ls‘: zu geringe 
Probenzahl; ‚th‘: Minimaldistanz nicht erreicht: ‚ns‘: nicht signifikant). Der COS 
Parameter misst das Nicht-Überlappen der Verteilungen (hier: 1, stark überlappend, 
bis 4, weitgehend getrennt). A vor -LT und kurzer A-Laut fallen immer zusammen: 
die Unterschiede sind nicht signifikant. Im Frankfurter Lautdenkmal (FraLD) misst 
man im Kontrastpaar [AA-1t] ein AC = 0 aus AC® = (0,0)" [0,0-0,0]. 
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A A-1t 
Sprehkee COS nı wı (Gı m un 16) AP u AC W 
FraLD = Im 8 a0 1 4 AU = Be - 

KG1 03 24 13 40 3 2 4,0 u ns - _ 
Rare 04 4 1ı 38 A 37 04m - - 
FraF3L 04 26 2 39 8 5 38 01 ns - 10 o7 

FaFAL 03 a 1 a0 6 a 39 01m -  - 
FraFAL 04 7 1 20 a A 37 083 ms - 10 of 
FraFAaaL 03 2 8 a0 a a 39 01m - - 
FraFJ1 02 11 1 40 3 3 4,0 _ ns - = 
FraLC ee Ale A A we ee 28 
KHMR  :05 24 17 a0 3 43708 * 08 en 
K09MR 04 24 18 40 6 4 4,0 = ns - _ 
K10MR 02 2 16 386 4 39 02 ns - - 
K61BE 04 13 1 40 4 3 4,0 u ns - z 
K62BE 05 12 11 40 4 3 4,0 _ ns - _ 


Tabelle 53: Beurteilung der Dialektalität des A vor -LT anhand der Merkmals- 
distanz ACP A vor -LT (A-1t) und des kurzen A-Lauts (A). Ein für die Frankfur- 
ter Stadtmundart typisches, signifikantes und dialektales Muster bzw. eine binäre 
Dialektalität wird mit x markiert (Hauptbedingung Ad > 0,5; Nebenbedingung 
(a < 3,55). O misst hier eine Verdunklung der Wortgruppe A-1t gegenüber der Wort- 
gruppe A. Sprecher, die die gegebenenfalls vorhandenen Worte alt bzw. kalt als [a:l] 
(0) bzw. [kPa:l] (f) artikulieren, erhalten pauschal den nach Marburger Konvention 
üblichen Aufschlag von +1 auf A( (nicht um Häufigkeiten korrigiert). Signifikanzen 
a: »*: hoch signifikant; x: signifikant; ‚ls‘: zu geringe Probenzahl; ‚th‘: Minimaldistanz 
nicht erreicht: ‚ns‘: nicht signifikant. COS: Bhattacharyya-Distanz als Maß für die 
Trennung der Verteilungen, — 1: getrennt; n: Probenzahl; w: Zahl der Stämme. Für 
Werte < 0,05 steht ‚—‘. Man beachte, dass die Wortgruppe A-1t Realisierungen mit 
und ohne Dehnungs-A umfasst (vgl. zu den Einzelwerten gegebenenfalls Abbildung 
134 auf S.470 im Anhang). Für alle Dialektsprecher ist kein signifikanter Abstand 
in dem Kontrastpaar [A»A-1t] messbar. Interessanterweise ist die einzige signifi- 
kante Abweichung, die aber noch nicht ausreicht, eine Verdunklungsdialektalität zu 
konstituieren, bei dem hochdeutschen Sprecher K07MR zu finden. 
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0 li: 2 3 4 B) 
1700 1825 1850 1875 1900 1925 


mhd. Hauptperiode 1825 1850 1875 1900 1925 1945 HD 
Ü/0: Frankfurt iji: i/i: v/y: 
wie brücke, (Ol) Ve 
hügel (Rauh) i/i 

ö/ö! Frankfurt e/e: e/e: e/p: 
wie löcher, (Ol) Mn 
öl (Rauh) e/e 

. a le Sense hun SEEN SEI ER: 
wie base Sachsenhausen i! e! 

ÜE Frankfurt de ih y! 
wie rüeben Sachsenhausen 00000000 a 


Übersicht: Die wichtigsten Lautentwicklungen für die Vorderzungenvokale mit 
hochdeutschen U- und Ö-Laut-Entsprechungen im Frankfurterischen, wie sie 
sich aus den Schriftbelegen ergeben (obere Zeile: erschlossene IPA Lautwerte; 
untere Zeilen: originale Lautzeichen der Quellen; HD: Hochdeutsch). Die Laut- 
werte sind über alle Periode unverändert: entrundet. 


9.10.1 Klassisches Frankfurterisch 


Wörter, die im Hochdeutschen die langen gerundeten Vorderzungenvokale [y:] und 
[:] aufweisen, erschienen im Frankfurterischen durchweg ohne Rundung, also mit 
[i:] und [er]. Dasselbe gilt für die kurzen hochdeutschen [v] und [oe], deren Frank- 
furterische Entsprechung [i] und [e] waren'?®. Zum Ü schrieb Oppel: „Der Vokal 
ü (7) [Anm.: 7 ist Oppels Vokalnummer] kommt nur in der von Kutschern (als 
Zuruf an die Pferde) gebrauchten Interjlektion] hüh vor, sonst nirgends in unserem 
Dialekt“ (OPF:1.102). Damit fielen im Frankfurterischen die Vorderzungenvokale 
alle in einer Form ohne Rundung zusammen. 

Welchen Lautwert hatten die ungerundeten Vorderzungenvokale im Frankfurte- 
rischen? Während die langen Vokale mit [ir] und [e:] ebenso wie im Hochdeutschen 
vorkamen, traf dies für ihre kurzen Äquivalente nicht zu: Während das Hochdeut- 
sche offene [1]- und [e]-Laute hat, erschienen im Frankfurterischen hier geschlossene 


135 Ausnahmen sind die kurzen [v] und [oe] vor historischem -R, die im Dialekt zu [#/ze:] geöffnet 
wurden (vgl. Abschnitt 9.12 ab S. 409). 
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[i] und [e]'®%. Nach Rauh war der lange I-Laut zwar „zuweilen |[...] etwas enger und 
auch die Zungenhebung etwas stärker“, aber: „(i) und (1) unterscheiden sich nicht 
durch die Klangfarbe, die in beiden Fällen geschlossen klingt“ (Rau: 40.1). Wie ge- 
schlossen der kurze I-Laut war und wie er sich vom kurzen eher offenen I-Laut des 
Hochdeutschen unterschied, lässt sich heute nicht mehr mit Sicherheit bestimmen. 
Rauh folgend sei der Lautwert des kurzen I-Lauts als geschlossenes [i] und nicht 
mit dem offenen [1] des Hochdeutschen angesetzt!?. Dass es nur einen I-Laut gab, 
bestätigte indirekt auch Oppel, der nur eine Vokalnummer - die 6 - für langes als 
auch kurzes I hatte: (i) und (1). Entsprechendes galt für den kurzen E-Laut [e], 
der die gleiche Qualität hatte, wie das lange [e:]: „(e) und (e) klingen geschlossen“ 
(Rau: 41.1). Auch hier schrieb Oppel nur eine Vokalnummer — die 4 - also (e) bzw. 
(&). Die gerundeten Vokale erhielten bei ihm die Nummern 7 für Ü und 10 für Ö; 
der Ä-Laut bzw. das offene E bekam die 3 zugewiesen. 

Die I- und E-Laute traten im Frankfurterischen zum einen an den Stellen auf, 
wo das Hochdeutsche die gerundeten Ü- und Ö-Laute hat — was für diesen Ab- 
schnitt das Wesentliche ist. Der Referenzlaut des normalisierten Mittelhochdeut- 
schen ist dabei irrelevant: Für altes Ü, Ü: und ÜE stand [i] bzw. [ir]; für öÖ, ö: und & 
stand [e] bzw. [er]. Was die anderen I- und E-Altlaute angeht, also altes 1, E, Ir, Er, 
I und E, ging das Frankfurterische grundsätzlich dem Hochdeutschen gleich. Für 
die Umgebungsdialekte ist die Entwicklung komplizierter (vgl. Abschnitt 9.10.1.1 
ab S.387). Insbesondere entsprach altkurzem I im Frankfurterischen ein I-Laut, 
genauso wie im Hochdeutschen und kein gesenkter E-Laut wie im Zentralhessi- 
schen!®®. Auch hatte das Frankfurterische wie die Hochsprache für den alten Di- 
phthong ıeE ein [ir]. 

Der hier skizzierte Zustand galt für das Frankfurterische über alle Hauptperi- 
oden. Da der Lautstand ohne Rundung sehr gut mit den schriftdeutschen Zeichen 
(e) und (i) markiert werden kann, ist es erlaubt, auch Mundartliteratur heran- 
zuziehen. Damit setzen die Belege schon Ende des 18. Jahrhunderts ein, also in 
Hauptperiode 0. 

Das Fehlen der Rundung an diesen Stellen wird oft als das Ergebnis einer regel- 
mäßigen Entrundung bezeichnet, die weite Teile der deutschen Dialektlandschaft 
und insbesondere auch das Zentralhessische sowie das Südhessische betreffen (Wie- 
singer [1980, 73] und Schirmunski [1962, 204£.]). Entrundung setzt voraus, dass die 
Vokale an den entsprechenden Stellen im Frankfurterischen einst rund waren - ent- 
standen aus ursprünglich ungerundetem Westgermanisch durch Rundung. Für das 
Frankfurterische in diesem Abschnitt sind das die Vokale, die altkurzem normali- 


136Das Frankfurterische hatte auch offene E-Laute. Diese gehen z.B. auf germanisches & zurück 
(vgl. Punkt 5a auf S.417), werden aber in diesem Abschnitt nicht weiter behandelt. 

137Nach Wiesinger (1980, 75) ist das Frankfurter I ein offenes (j). Ausnahme für frankfurterisch 
kurzes geschlossenes [i] ist die zweite Diphthongkomponente in [aı/or], die stets offen ist; vgl. 
Punkt 7, S. 411. 

138Der Urzustand des Frankfurterischen in der Zeit vor Einsetzen der Belege mag jedoch sehr 
wohl gesenktes I gewesen sein (vgl. Eintrag 4a auf $. 416). 
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sierten mittelhochdeutschen Ü und Ö, altlangem ® und dem alten Diphthong ÜE 
entsprechen. Das sind die gerundeten Vokale des normalisierten Mittelhochdeut- 
schen. Ob und in welchem Umfang im Frankfurterischen des Mittelalters einstmals 
Rundung vorlag oder ob alter ungerundeter Lautstand bewahrt wurde, lässt sich 
aus den Urkunden nicht eindeutig erschließen!?®. 


9.10.1.1 Die runden Vokale in den Vororten 


Die fehlende Rundung galt auch für die Frankfurter Vororte, obwohl hier die Si- 
tuation für & und ÜE deutlich vielfältiger war. In Seckbach, Preungesheim und 
Berkersheim, die zu Rauhs Zeiten noch zentralhessisch geprägt waren, fand sich 
etwa für altlanges & ein [ir] anstatt des frankfurterischen [e:], z. B. nhd. böse, mhd. 
beese, kFra. [be:s], aber dort [bi:s]. Alter Diphthong ÜE war in diesen Vororten [or], 
entgegen [ir] im Frankfurterischen, z.B. nhd. müde, mhd. müede, kFra. [mirt], aber 
dort [mort]. Diese archaischen Diphthonge waren im Sachsenhausen der Hauptpe- 
riode 4 (1900-1925) nur noch von alten Leuten und nur in Einzelworten zu hören, 
z.B. nhd. Rüben, mhd. rüeben, kFra. [rorvo] oder nhd. Kohl, mhd. keele, kFra. [kill]. 


9.10.2 Ausgewählte Schriftbelege 
1. Altkurzes Ü: 


()Ü> [ij > kayl 
» Brücke. (brücke). > [prik]: OP?, 1.17.6: uff der Sachsehäuser Brick. 
RAU“, 108.1: prik. — » drücken. (drücken). > [trigo]: OP?, 1.22.7: Am 
de Daume uffs Ach tricke. RAU*, 108.1: trigo. — » Hütte. (hütte). > [hit]: 
Rau, 108.1: hit. — » Müller. (müller). > [mil&]: OPF?, 1.5 S. 70: Miller. 
— » Rücken. (rücken). > [rigo]: OP?, 1.54.15: Rick. RAU, 108.1: rigo. 
— » über. (über). > [iv&]: OP?, 1.42.11: iwwer. Raut, 108.1: iwä. 


1395 existiert aus Frankfurt kein lyrisches Werk des Mittelalters, aus dem ein Lautwert eindeu- 
tig aus Reimbildung abgeleitet werden könnte. Spezielle Grapheme für die heutigen hochdeut- 
schen Ü- und Ö-Laute tauchen in mitteldeutschen Schriften wie z.B. Frankfurter Bibeldrucken 
erst im 16. Jahrhundert auf (Bahder [1890, 44] und Moser [1929, 26]). In den mittelalterlichen 
handschriftlichen Frankfurter Urkunden sind sie unmarkiert, was nach Bahder (1890, 206) im 
Mitteldeutschen durchaus üblich war. Häufig sind in Frankfurt U- und O-Grapheme, die aber 
nicht mit dem un-umgelauteten Stamm in Bezug stehen müssen. Es folgen einige Belege für Ü 
aus Frankfurter Urkunden des Mittelalters, die allesamt Wülcker (1877, 14 und 22) entnommen 
sind (die Jahreszahl des Belegs ist in Klammern nachgestellt): (fosse), Füchse (1373); (fonffzig), 
fünfzig (1362); (molsteyn), Mühlstein (1439); (steynhotten), Steinhütten (1384); (zu der hotten), 
Hütte (1457); (molen), Mühlen (1400); (slogslossel), Schüssel zum Schlagbaum (1461). Belege für 
Ö: (buge), Böcke (1396); (furstern), Förster (1431); (gluckelchen), Glöckchen (1472); (kulschen), 
Kölner (1330); (lucher), Löcher (1396); (mogelich), möglich (1317); (rucke), Röcke (1372). Die O- 
und U-Grapheme könnten hier für E- und I-Laute stehen, wie von Moser (1929, 104) für manche 
mitteldeutsche Schriften angemerkt. Direkte E- oder I-Grapheme finden sich in den Urkunden 
nicht. 
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b)ür > [ir > haly] 
» Hügel. (magel, > [hiräl]: Rau, 108.1: hisl. — » schüren. (schüren). 
> [e:]?: OP?, 1.32.6: des Feuer scheern, „die Form scheern stammt wohl von 
den Nachbarmundarten “ (Anm. Rauh). > [firen]*: Rau*, 108.1: sn. — 
» spüren. (spüren). > [fbiren]: OP?, 1.30.14: gespiert. RAu?, 108.1: $bi*n. 


2. Altkurzes Ö 


(a)ö > [el > hd.le] 
» Böcke. (böcke). > [bek]: OP?, 1.47.3: Beckelche (Dim.). Rau‘, 105.1: 
bek. — » Knöchel. (knöchel). > [kne3l]: OP?, 1.47.3: Knechel, Knechel- 
che, Knelchelcher (Dim. Sing. und Pl.). RAu*, 105.1: knesl. — » Löcher. 
(löcher). > [lez&]: OP?, 1.47.3: Lechelche, Lechelcher (Dim. Sing. Pl). 
RAU‘, 105.1: lesä. — » tröpfeln. (tröpfen). > [trebalo]: OP, 1.5.2: 
drebbele. RAuU?, 105.1: trebolo. 


(b)ö: > [el > ha.ler] 
» Höhle. (<hölern). > [he:l]; OP?, 1.29.2: Heel. Rau?, 105.1: hal. — 
» Öl. (ö). > [eil]: OP?, 1.33.10: Eelelamp (Öllampe). RAu*, 105.1: el. — 
» Vögel. (vögel). > He:ät]: vgl. Vogel, S. 289. 


3. Altlanges @: 


@ > [el] »> hd.[er] 

» blöd. (blede). > [ple:t]; Rau“, 130.1: plet. — » böse. (be&se). > [bes]: 
OPZ?, 1.36.2: bees. WS?, 14: bese. Rau‘, 130.1: bes. © Sachsenhausen: > 
[bi:s]: Rau?, 130 Anm. 2: bis, „von alten Sachsenhäusern “. > [be:s]?: WS?, 
14: bese. © Bornheim, Eckenheim: > [birs]?: WS?, 14: bise, biese. © Oberrad: 
> [birs]?: FR25°: biise. > [be:s]*: FR25*: beese. © Seckbach, Preungesheim, 
Berkersheim: D& [bi:s]*: Rau, 7.1: bis. — » größer. (grezer). > [kre:z&]: 
vgl. gross, S. 289. — » Kohl. (kele). > [kPerl];: Rau, 130.1: khel. © Sach- 
senhausen: D& [kPirl]: RaAu?, 130 Anm.2: khil, „bis zum heutigen Tag“. © 
Seckbach, Preungesheim, Berkersheim: D [k"iıl]*: Rau?, 7.1: khil. — » schön. 
(schene). » [fe:]*: OPF?, 1.367: schee ehones). RAU“, 130.1: Se, Senä, Sensdo 
(schön, schöner, Schanste fer]: Rau“, 130.1 Aka. 1: „die Halbmundart 
bervorzugt“ Se, Senä, Sensdo (schön, schöner, schönste). 


4. Alter Diphthong ÜE: 


()ÜE > [ir > haly] 
» Füße. (füeze). > [fs]: OPF?, 1.526: Fiße. WS?, 8: Fiß. © Bornheim, 
Eckenheim: > [fors]’: WS?, 8: Feuß, Föuß. © Ober D [or]?: WS?, 8 
Fiß. FR25?, WS8: Fäiß. > [His]: i Fr258, WS8: Fiißk. © Saheenkadsen: 
D [foıs]?: 118°: fois. > [firs]?: WS?, 8: Fieß. © Seckbach, Preungesheim, 
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Berkersheim: D [foıs]: Raut, 7.1: fois. — » Mühe. (müeje). > [mi!]: 
OP?, 1.51.2: Mih. RAU?, 118: mi. — » Rübe. (rüebe). > [rirvo]: OP?, 
1.23.16: Riew&. © Sachsenhausen: > [romvo]?: RAu?, 118: Roiwo, „von al- 
ten Sachsenhäusern “. © Seckbach, Preungesheim, Berkersheim: D [roıvoa]*: 
RAU“, 7.1: Roiwo. — » spülen. (spüelen). > [fbi:lo]: OP?, 1.45.16: Spiel- 
brenk (Spülbecken). RAU?, 118: $bilo. — » trüb. (truebe). > [trirp]: OP?, 
1.16.9: im Triewe fische (im Trüben fischen). RAu?, 118: trip. — » wühlen. 
(wüelen). > [virlo]: © Sachsenhausen: > [vorlo]’: Rau?, 118: woilo, „von 
alten Sachsenhäusern “. 
(bJ)ÜE > [il > ha.ly] 

> brüllen. (brüellen). > [prrilo]: OP?, 1.7.2: brillt. Rau, 118: prilo. — 
» füttern. (vüettern). > [fidä&n]: OP?, 1.43.10: fiddern. RAU?, 118: fidän. 


9.10.3 Die Kontrastgruppen I E U Ö im VokalJäger 


Die in diesem Abschnitt behandelte Frage nach der Rundung bzw. Entrundung 
im Frankfurter Stadtdialekt ist von besonderer Bedeutung, da hier, im Gegen- 
satz zu den vorangegangenen Abschnitten, ein weiteres, neues gleitendes Merkmal 
mit dem VOKALJÄGER genutzt werden soll: Der Rundungsgrad der Vorderzun- 
genvokale (vgl. Abschnitt 5.3.2, S.195£.). Dieses Merkmal ist konstruiert, nur auf 
das Vorliegen der Rundung zu fokussieren. Dies ist vorteilhaft, sind doch gerade 
bei den kurzen I- und E-Lauten Unterschiede im Öffnungsgrad zwischen Dialekt 
und Hochsprache zu erwarten, deren Bedeutung aber bei der Einschätzung des 
Rundungsgrads irrelevant ist. Es werden folgende Kontrastgruppen gebildet aus 
Lauten, die im Hochdeutschen durchgängig rund oder ungerundet sind'*°. 


I, Ir Wörter mit kurzem bzw. langem I-Laut im Hochdeutschen: Das klas- 
sische Frankfurterische hatte hier [i] bzw. [ir], das Hochdeutsche hat [1] 
bzw. [ir]. In beiden Fällen ist der Laut ungerundet. 


E, Er Wörter mit kurzem bzw. langem E-Laut im Hochdeutschen: Das klas- 
sische Frankfurterische hatte hier [e] bzw. [er], das Hochdeutsche hat [e] 
bzw. [e:]. In beiden Fällen ist der Laut ungerundet. 


Ü, Ü: Wörter mit kurzem bzw. langem U-Laut im Hochdeutschen: Das klas- 
sische Frankfurterische hatte hier [i] bwz. [ir], das Hochdeutsche hat [v] 
bzw. [y:]. Im Frankfurterischen ist der Laut ungerundet, im Hochdeut- 
schen rund. 


Ö, Öz Wörter mit kurzem bzw. langem Ö-Laut im Hochdeutschen: Das klas- 
sische Frankfurterische hatte hier [e] bzw. [e:], das Hochdeutsche hat [ce] 


140m mögliche Verzerrungen zu vermeiden und Material für andere Untersuchungen zu segre- 
gieren, sind diesen Kontrastgruppen keine Laute in der Konstellation vor historischem -R, keine 
germanischen E bzw. Er sowie keine A-Umlaute zugewiesen. 
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bzw. [o:]. Im Frankfurterischen ist der Laut ungerundet, im Hochdeut- 
schen rund. 


Im Hochdeutschen ist ( = 1 für die Kontrastgruppen I, Ir, E und Er, die im 
Hochdeutschen ungerundete Vokale enthalten. Für das Frankfurterische gilt das- 
selbe und diese Kontrastgruppen bilden die Referenz der Untersuchung. Im Hoch- 
deutschen wird erwartet, dass die Kontrastgruppen U, Ur, Ö und Ö: ihrer Rundung 
entsprechend ein ( = 2 aufweisen. Im Frankfurterischen sollte der Befund aber 
abweichend sein: es gibt keine Rundung und in diesen Gruppen sollte eind = 1 zu 
finden sein. Entsprechend sollte die Merkmalsdifferenz immer AC = 0 in Kontrast- 
paaren betragen, die nur ungerundete Vokale enthalten. Im Beispiel [Ix Er] gilt 
dies sowohl für die Hochsprache als auch für das Frankfurterische. Für hochdeut- 
sche Sprecher sollte eine signifikante Merkmalsdifferenz Al = 1 in Kontrastpaaren 
aus runden und ungerundeten Vokalen zu finden sein, etwa in [Ö: Er: ]; für das 
Frankfurterische hingegen sollte sich hier wieder ein AG = 0 ergeben: Von der 
Rundung bzw. der Nicht-Rundung her fallen die Kontrastgruppen zusammen und 
unterscheiden sich nicht. 

Ein Sprecher bzw. eine Sprachprobe wird als Frankfurterisch markiert, wenn 
vor allem in den Kontrastpaaren [Iz “Y:z] und [Er »Ö:] kein signifikanter Ab- 
stand gemessen wird, also AG = 0. Als hinreichende Nebenbedingung soll für die 
Kontrastgruppen Ux und Ö: einC <1,5 gelten!*. 

Exemplarische Messwerte des VOKALJÄGERS für die Merkmalswerte ( und 
die Merkmalsdifferenzen AC der langen Vokale (Gruppen Iz, Er, Ur und Ör) sind 
in Tabelle 54 auf S.391 wiedergegeben. Die vollständigen Ergebnisse sind zu ( 
in Abbildung 112 auf S.393 (lange Vokale) und Abbildung 113 auf S. 394 (kurze 
Vokale); zu AG in Abbildung 114 auf S. 395 (lange Vokale) und Abbildung 115 auf 
5.396 (kurze Vokale); zu AC"P in Abbildung 151 auf $.483 (lange Vokale) und 
Abbildung 152 auf S. 484 (kurze Vokale) dokumentiert; Einzelheiten zum Aufbau 
der Kontrastgruppen und den (® und C! sind im Anhang ab Abbildung 135 auf 
S.471f. dargestellt; Zahlenwerte und ein Test auf Frankfurterische Dialektalität 
hinsichtlich der Kontrastpaare [U: “I: ] und [Or »E:] finden sich in Tabelle 55 
auf S. 397. 


9.10.4 Diskussion 


Es zeigt sich das erwartete Bild: Das Frankfurter Lautdenkmal ist durchweg un- 
gerundet bzw. entrundet. Man findet sowohl für die ungerundeten als auch die 
hochdeutsch runden Vorderzungenvokale immer ein C = 1 und Merkmalsdifferen- 
zen sind in allen Kontrastpaaren nicht messbar, also AC = 0. Im Frankfurter 
Lautdenkmal fallen, was die Rundung betrifft, alle Vorderzungenvokale, gleich ob 
lang oder kurz, im ungerundeten Zustand zusammen. In den Kontrastgruppen Iz, 


141Der Fokus auf lange Vokale schränkt die Aussage nicht ein und ergibt sich aus den deutli- 
cheren Messergebnissen (vgl. Abschnitt 9.10.4 ab S. 390). 
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AC AG 
I: Er Ü: I: E: Ü: 
kFra C 10.10 190 FraLD ( 10 10 190 
I: i 1,0 I: 1,0 
BE: e 1,0 — 2 10. (-)% 
Ü: i 1,0 = - Us Eee 
Ö: e 1,0 Ö: 10: I PIE! 
AC Ac 
I: Er Ü: I: Er Ü: 
HD C 10 10 20 FraFJ1 (C 1:0: 11.90 
I: ı 1,0 I: 1,0 
E: ei 1.1. 0,1) z 1.1. -0,0)° 
Ü: yı 20: » 10° 10,9% Ü: 2.00 0.09 
Ö: 9: 2,0 1,0% 0,9** (-)® Ö: 2,0 1,0% 0,9** (-)® 


Tabelle 54: Exemplarische Merkmalswerte C und Merkmalsdifferenzen A( für Vo- 
kale mit hochdeutsch runder Entsprechung (lang) im Kontrast. —kFra: ideelle Re- 
ferenzwerte eines Sprechers des klassischen Frankfurterischen aus Hauptperiode 4 
(1900-1925); HD: entsprechende Aussprache im Hochdeutschen. —Messungen mit 
dem VOKALJÄGER: FraLD: Das Frankfurter Lautdenkmal von 1937; FraFJ1: Spre- 
cher des Neu-Frankfurterischen, hier mit nahezu hochdeutschem Lautmuster. An- 
gesetzt wurde das gleitende Merkmal des Rundungsgrads der Vorderzungenvokale. 
FraLD zeigt vollständige Entrundung: der Rundungsgrad z.B. der Gruppe Örz ist 
mit C = 1,0 [1,0-1,0] gleich ungerundet wie der der Gruppe der Er mit ( = 1,0 
[1,0-1,0]. Entsprechend ist beträgt die Distanz AC = 0 aus AC® = (0,0) [0,0-0,0] 
im Kontrastpaar [Dr »Ez]. Bei FraFJ1 ist hingegen Rundung festzustellen und die 
Werte betragen C = 2,0 [2,0-2,0] (ö:), C = 1,1 [1,0-1,5] (Er) und AG = 0,88** [0,88- 
1,00] (alle Werte in den Tabellen sind mit einer Stelle Genauigkeit wiedergegeben; 
nicht-signifikante originäre AC® sind jeweils in Klammern gesetzt und stehen für ein 
endgültiges Al = 0; das Signifikanzniveau ist hochgestellt; Werte mit AC® < 0,05 
sind als ‚— gedruckt). 
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Er, Ur und Ör misst man jeweils ein C = 1,0 [1,0-1,0], also ungerundeten Zustand 
und z.B. in den Kontrastpaaren [Ir „Ur ]| und [Er 6: ] jeweils ein AC = 0 aus 
AC’ = (0,0)"° [0,0-0,0], also keinen Rundungsunterschied (wobei allerdings die 
Probendichte für Ör sehr niedrig ist). 

Demgegenüber weisen die hochdeutschen Sprecher das erwartete abweichen- 
de Bild auf: Man misst ein Rundung anzeigendes ( = 2 in den Kontrastgruppen 
U: und Ör, wo das Frankfurter Lautdenkmal ein (€ = 1 hat. Hochdeutsche Spre- 
cher haben in den Kontrastpaaren [Ö: vEz] und [Ix »Ü:z | die erwartete Distanz 
AC #1, das Frankfurter Lautdenkmal hat Al = 0. Für den hochdeutschen Spre- 
cher K07MR misst man z.B. folgende Merkmalswerte: Cd = 1,00 [1,00-1,15] für 
Ir und ( = 1,0 [1,0-1,0] für Ex, also in beiden Fällen ‚ungerundet‘ und ( = 2,0 
[2,0-2,0] für Ur und Ör, also ‚rund‘. Als Merkmalsdifferenz ergibt sich AC = 1,0** 
[1,0-1,0], jeweils in den Kontrastpaaren [Iz „U: | und [Er "Ö:]. Für die kurzen 
Vokale gilt bei den hochdeutschen Sprechern tendenziell das Gleiche. Es fällt aber 
auf, dass die Messergebnisse für die langen Vokale weniger streuen als die kurz- 
en, was im Vergleich der Abbildungen 112 auf S.393 und 113 auf S.394 gut zu 
erkennen ist. Das hat zum einen den Grund, dass der VOKALJÄGER auf genau 
die langen Vokale trainiert wurde. Zum anderen liegt gerade das hochdeutsche 
kurze [r] formanttechnisch in einem Übergangsbereich zwischen rundem [y:] und 
ungerundetem [e:] (vgl. Abbildung 56 auf S. 151). Auch sind die Probenzahlen oft 
zu gering, um verlässliche Aussagen treffen zu können. Allerdings finden sich die 
finalen G trotz Streuung sowohl für die kurzen als auch für die langen Vokale im 
Bereich des Erwarteten wieder, was für das Konzept des VOKALJÄGER spricht. 

Für die Neu-Frankfurter Sprecher ist das Bild durchwachsen. Manche Spre- 
cher wie FraF.J1 weisen keine Entrundung auf bzw. haben signifikantes Al > 0 in 
Kontrastpaaren aus runden und ungerundeten Gruppen — ganz gleich dem Hoch- 
deutschen. Interessant ist der Fall von FraA2L, der nominal niedrige Abstände 
aufweist, die eigentlich für eine Entrundung sprechen: AC = 0,4** [0,4-0,8] im 
Kontrastpaar [Or vEz | und Al = 0,3* [0,3-0,6] in [Ix »Üz ]. Doch sind diese Ab- 
stände signifikant, womit geschlossen werden kann, dass für diesen Sprecher die 
Laute hinsichtlich ihrer Rundung noch unterschiedlich sind: Es liegt keine signifi- 
kante Entrundung vor. 

In den Belegen zum Frankfurterischen der 1980er aus Broxten (1985, 34f.) zeigt 
sich Entrundung bei den älteren Sprechern. Die jüngeren Sprecher in ihrer Probe 
sprachen - dem Hochdeutschen gleich - tendenziell mit Rundung. Eine Bestätigung 
für die Neigung zur Auflösung der Entrundung findet man bei Friebertshäuser/ 
Dingeldein (1988, Karten 31 und 44): Frankfurt hatte Ende der 1980er durchweg 
[v] in Strümpfe und [y:] in Füße - dialektale [1] und [ir] bzw. in letzterem Fall auch 
[or] wurden nur noch im Umland gefunden. 
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Rundungsgrad (lange Vokale) 
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Abbildung 112: Die langen runden und ungerundeten Vorderzungenvo- 
kale (Ü:, Ör, Ir, Er) im VOKALJÄGER. Verteilung des gleitenden Merkmals des 
Rundungsgrads der Vorderzungenvokale ( für verschiedene Sprecher. Anordnung in 
Gruppen von links nach rechts: LD: Lautdenkmal; HD: Hochdeutsch in Auswahl 
und Mittel; NF: Neu-Frankfurterisch, insbesondere REDE. Das Symbol und der 
unten gedruckte Wert zeigen den Median an, also (; der vertikale Strich den (- 
Interquartilbereich zwischen dem 25%- und 75%-Perzentil. Das obere Zahlenpaar 
protokolliert die Probenzahl n und Zahl der Stämme w, getrennt mit ‚/‘. Allgemein 
gilt für ‚ungerundet‘ ein d — 1 und für ‚rund‘ ein C — 2. Die ungerundeten Vor- 
derzungenvokale weisen erwartungsgemäß einen niedrigen Rundungsgrad auf. So hat 
z.B. K07MR für I: ein C = 1,00 [1,00-1,15], also ‚ungerundet‘, und Ur ein C = 2,0 
[2,0-2,0], also ‚rund‘. Im Frankfurter Lautdenkmal hingegen ist C = 1,0 [1,0-1,0] 
sowohl für Iz und Ex als auch für Üx und Ör, was von völliger Entrundung zeugt. 
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Rundungsgrad (kurze Vokale) 
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Abbildung 113: Die kurzen runden und ungerundeten Vorderzungenvokale 
(U, 6, 1, E) im VOKALJÄGER. Verteilung des gleitenden Merkmals des Rundungsgrads 
der Vorderzungenvokale ( für verschiedene Sprecher. Anordnung in Gruppen von 
links nach rechts: LD: Lautdenkmal; HD: Hochdeutsch in Auswahl und Mittel; NF: 
Neu-Frankfurterisch, insbesondere REDE. Das Symbol und der unten gedruckte Wert 
zeigen den Median an, also (; der vertikale Strich den G-Interquartilbereich zwischen 
dem 25%- und 75%-Perzentil. Das obere Zahlenpaar protokolliert die Probenzahl 
n und Zahl der Stämme w, getrennt mit ‚/‘. Allgemein gilt für ‚ungerundet‘ ein 
GC — 1 und für ‚rund‘ ein G — 2. Die ungerundeten Vorderzungenvokale weisen 
erwartungsgemäß einen niedrigen Rundungsgrad auf. Im Frankfurter Lautdenkmal 
ist C = 1,0 [1,0-1,0] sowohl für I und E als auch für U und Ö. Dieses Muster der 
Entrundung wiederholt sich in dieser Deutlichkeit bei kaum einem anderen Sprecher. 
Der hochdeutsche Sprecher K62BE hat hingegen z.B. für I ein ( = 1,0 [1,0-1,4], also 
‚ungerundet‘, und für Ü ein C = 2,0 [1,8-2,0], also ‚rund‘. 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


Rundung der Vorderzungenvokale 395 


Intra-Sprecher-Distanzen: Rundungsgrad (lange Vokale) 


Abbildung 114: Merkmalsdistanz A(C zwischen den hochdeutsch langen run- 
den Vorderzungenvokalen (Ü:, Ör) als Referenz und den langen ungerundeten 
Vorderzungenvokalen (Iz, Ex) desselben Sprechers als Vergleich (Symbol: Merkmals- 
wert ( der Referenz; vertikaler Strich und Zahl: originäre Differenz AC® bezüglich 
des gleitenden Merkmals des Rundungsgrads der Vorderzungenvokale (ungerundet: 
GC 1; rund ( — 2); das andere Ende des Strichs zeigt mit dem Symbol ‚—‘ das ( 
des Vergleichslauts an). Referenz- und Vergleichslaut gelten als unterschiedlich, falls 
die Distanz AC® signifikant ist (**: hoch signifikant; x: signifikant; ‚ls‘: zu geringe 
Probenzahl; ‚th‘: Minimaldistanz nicht erreicht: ‚ns‘: nicht signifikant). Der COS Pa- 
rameter misst das Nicht-Überlappen der Verteilungen (hier: 1, stark überlappend, 
bis 4, weitgehend getrennt). Im Frankfurter Lautdenkmal (FraLD) ist erwartungsge- 
mäß kein Unterschied in den Kontrastpaaren aus Wörtern zu finden, die hochdeutsch 
runde und ungerundete Entsprechungen haben, so misst man z.B. in [Ür »Erx] ein 
AC = 0 aus AC® = (0,0)" [0,0-0,0]. Hochdeutsche Sprecher weisen im Kontrast eine 
Rundungsdifferenz auf, so z.B. im selben Paar bei K07MR ein AC = 1,0** [1,0-1,0]. 
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Intra-Sprecher-Distanzen: Rundungsgrad (kurze Vokale) 


Signifikanz 
n* 

2 

ols 

+ ns 

x th 


Abbildung 115: Merkmalsdistanz AG zwischen den hochdeutsch kurzen runden 
Vorderzungenvokalen (VÜ, Ö) als Referenz und den kurzen ungerundeten Vorder- 
zungenvokalen (I, E) desselben Sprechers als Vergleich (Symbol: Merkmalswert ( der 
Referenz; vertikaler Strich und Zahl: originäre Differenz AC® bezüglich des gleiten- 
den Merkmals des Rundungsgrads der Vorderzungenvokale (ungerundet: d — 1; rund 
G — 2); das andere Ende des Strichs zeigt mit dem Symbol ‚—‘ das ( des Vergleichs- 
lauts an). Referenz- und Vergleichslaut gelten als unterschiedlich, falls die Distanz 
AC® signifikant ist (**: hoch signifikant; x: signifikant; ‚ls: zu geringe Probenzahl; ‚th‘ 
Minimaldistanz nicht erreicht: ‚ns‘: nicht signifikant). Der COS Parameter misst das 
Nicht-Überlappen der Verteilungen (hier: 1, stark überlappend, bis 4, weitgehend 
getrennt). Im Frankfurter Lautdenkmal (FraLD) ist erwartungsgemäß kein Unter- 
schied in den Kontrastpaaren aus Wörtern zu finden, die hochdeutsch runde und 
ungerundete Entsprechungen haben, so misst man z.B. für [ÜvE] ein AC = 0 aus 
AC® = (0,0)"$ [0,0-0,0]. Hochdeutsche Sprecher weisen im Kontrast eine Rundungs- 
differenz auf, so findet man z.B. für [IÜ] ein AG = 1,0** [1,0-1,0] bei K10MR - 
allerdings ist oft die Probenzahl (zu) gering oder der Effekt nicht so deutlich wie bei 
den langen Vokalen. 
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: Tz 
Sprehee COS nı m hı m wm & A a A 9 
FraLD 0,1 96 10 27 3 10 - ns - 10 x 
KG1 3 8.6127 ee BR 
KG2 DA. 29239 18 1 A Der er - Ber ee 
"Hardt 05 5 23902 110 10 * Lo. 
FraF3L 0,1 14 6 18 A 12 12 06 ns - _ 
FraF4L 0,6 6 13 2 10 10 03 *03 - 
FaFAlL 04 5 5 0 82 10 - ms - 10 x 
FraFA2DL 05 6 6 16 A 13 13 03 *03  - 
FraFJ1 075 5 20 28 13 10 10 * 10 - 
FraLC 022 A A122 4 2 10 02 m - 09 « 
KorM 10 4 A 20 3 202 10 10 #10 - 0° 
K09MR 09 A A 20 25 20 10 10 * 10 - 
KIOMR 10 4 4 20 4 19 10 10 * 10 - 
KBE 10 8 8 20 3 8 10 10 * 10 - 
KOBE 10 8 8 20 3 8 10 10 * 10 - 
! Er 
FraLD 02° 1. 0 00,19% 28 SEO. Nr 
"Farmer "08 7 2 20 20.8 18 1.0 #0 =" 
FraF3L 06 1 5 17 27 10 11 06 * 06 - 
FaFALL 04 6 5 10 0 9 10 - m - 10 x 
FraFAlL - 1015 11023 9 13 03 ns - 09 x 
FraFA2L 0,7 6 5 18 2 1 13 04 * 04 - 
FraFJ1 09 6 5 20 21 10 11 09 * 09 - 
FraLC 046 A 13 19 9 10 03 ss - 098 x 
KOM 2 7, 7 2 a 2 = m nm 
K09MR 1,0 7 7 20 30 24 10 10 * 10 - 
K10MR 1,0 7 720 23 23 10 10 * 10 - 
K61BE 106 5 20 1 9 10 10 * 10 - 
K62BE 096 5 2015 9 10 10 * 10 - 


Tabelle 55: Beurteilung der Dialektalität der langen runden und ungerundeten 
Vorderzungenvokale anhand der Merkmalsdistanz AC hochdeutsch runder Vokale 
(Ü:, Ör) und ungerundeter Vokale (Iz, Er). Ein für die Frankfurter Stadtmundart 
typisches, signifikantes und dialektales Muster bzw. eine binäre Dialektalität wird 
mit x markiert (Hauptbedingung AC < 0,25; Nebenbedingung (ı < 1,5). ® misst 
hier den Merkmalsunterschied zwischen dem (€ der Gruppen U: bzw. Ör und dem 
hypothetischen d = 2 des Hochdeutschen. Signifikanzen a: »x: hoch signifikant; x: 
signifikant; ‚Is‘: zu geringe Probenzahl; ‚th‘: Minimaldistanz nicht erreicht: ‚ns‘: nicht 
signifikant. COS: Bhattacharyya-Distanz als Maß für die Trennung der Verteilungen, 
— 1: getrennt; n: Probenzahl; w: Zahl der Stämme. Für Werte < 0,05 steht ‚—“. 
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9.11 Zusammenfassung: Ein Vokalwandel in Real-Time 


In den vorangegangen Abschnitten 9.2 bis 9.10 wurden ausgewählte Einzelphäno- 
mene des Frankfurter Stadtdialekts beschrieben und untersucht. Wie stellen sich 
die Ergebnisse im Gesamtbild dar? 


9.11.1 Frankfurterisch im Frankfurter Lautdenkmal 


Tabelle 56 auf S.399 fasst die Messungen für das Frankfurter Lautdenkmal von 
1937 zusammen: Insgesamt wurden zwölf Dialektmuster klassifikationsphonetisch 
mit dem VOKALJÄGER vermessen. Die Ergebnisse werden mit dem verglichen, was 
für einen idealtypischen Sprecher des klassischen Frankfurterischen aus Hauptpe- 
riode 4 (1900-1925) zu erwarten gewesen wäre. Die Erwartungshaltung wieder- 
um ergibt sich aus den phonetisch-phonologischen Aussprachelemmas, wie sie von 
Ludwig Rauh handschriftlich in seiner Lautlehre der Frankfurter Mundart (Rauh 
1921a) notiert wurde und dem Transfer derselben in die mathematisch-technische 
Sprache des VOKALJÄGERSs: Im Einzelnen sind das der Merkmalswert ( aus Formel 
(36), S.183, die Merkmalsdistanz AC aus Formel (37), S.187, und die numerische 
Dialektalität aus Formel (39), S.189, die dem Marburger D-Wert ähnlich ist. 

Von den zwölf Mustern testen zwei auf volle Identität mit dem Hochdeutschen 
hinsichtlich des gleitenden Merkmals der Öffnungsstufe der Hinterzungenvokale: 
Da ist zum einen das neutrale A per se, also Kontrastgruppe A (vgl. Abschnitt 
9.3 ab S.297). Das neutrale A dient vor allem als Referenzpunkt für andere Mes- 
sungen. Hier misst man ein C = 4,0 [4,0-4,0], was exakt der erwartete Wert des 
Hochdeutschen ist. Zum anderen handelt es sich um das A vor -LT, also Kon- 
trastgruppe A-1t (vgl. Abschnitt 9.9 ab S. 375). In diesem Fall ist ein klanglicher 
Zusammenfall mit dem neutralen A erwartet, also mit Referenzgruppe A!*?. Das 
bestätigt sich im Frankfurter Lautdenkmal: Eine Merkmalsdistanz ist mit Al = 0 
aus AC = (0,0)" [0,0-0,0] in dem Kontrastpaar [A A-1t] nicht messbar. 

In weiteren drei Fällen ist rein technisch die Dialektalität durch einen Null- 
Abstand definiert: Es wird erstens erwartet, dass im Frankfurterischen das lange 
und das kurze O klanglich in einem geschlossenen [o|-Laut zusammenfallen. Die 
Bezugsgröße ist abermals die Öffnungsstufe der Hinterzungenvokale (vgl. Abschnitt 
9.2, S.287f.). Entsprechend sollte in dem Kontrastpaar [Or 0] kein Unterschied 
zu messen sein. Es ergibt sich Ad = 0 aus AC® = (0,5)"® [0,0-0,5]. Zwar ist die 


142]m engeren Sinn für das klassische Frankfurterische betrifft das die Konstellation ohne Auf- 
lösung des Verschlusses. Bei Auflösung und Dehnung, welche aber nur bei den Wörtern alt, bald 
und kalt vorkam, trat im Frankfurterischen der Hauptperiode 4 Verdunklung ein. Da aber das 
Frankfurter Lautdenkmal keine Belege für diese Untergruppe liefert und das Neu-Frankfurte- 
rische in letzterer Konstellation nicht verdunkelt, gilt die Erwartung des Zusammenfalls mit dem 
neutralen A faktisch allgemein. 
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originäre Merkmalsdistanz AC’ > 0, doch ist der Abstand aufgrund der Überlap- 
pung der Or- und 0-Gruppen nicht signifikant. Dieses Al = 0 zeugt nun von dem 
erwarteten Zusammenfall der langen und kurzen O-Laute hinsichtlich ihrer voka- 
lischen Qualität in einem Wert. Im Frankfurterischen misst man in der Gruppe 0: 
ein C = 2,0 [2,0-2,5], was dem [o:] des Hochdeutschen entspricht. In der Gruppe O 
findet man ein ( = 2,5 [2,0-2,7], was zwar unterschiedlich zur Ox-Gruppe ist, aber 
eben nicht signifikant unterschiedlich. Dieser Zusammenfall bzw. Null-Abstand ist 
ein Zeichen vorliegender Dialektalität. AC kann in das Maß der numerischen Dia- 
lektalität überführt werden und man errechnet ein d = 0,8. ® misst hier die hy- 
pothetische Bewegung des kurzen O-Lauts aus seiner hochdeutschen [5]-Position 
heraus, hin zu [o] - idealtypisch wäre ein Ergebnis von d = 1, was sich annähernd 
hier findet. Ähnlich laufen die Tests auf Entrundung bzw. das Fehlen der Rundung 
der Vorderzungenvokale ab: Erwartet wird, dass im Frankfurterischen Vokale, de- 
ren hochdeutsche Entsprechung rund ist, mit denen zusammenfallen, die ungerun- 
det sind. Maßgeblich ist hier nun das gleitende Merkmal des Rundungsgrads der 
Vorderzungenvokale (vgl. Abschnitt 9.10, S.385f.). In den entsprechenden Kon- 
trastpaaren — die Tabelle zeigt exemplarisch [Ur »Iz] und [Ör »E: ] - sollte kein 
Unterschied messbar sein: alle Laute sind gleich ungerundet. Auch das findet sich 
im Frankfurter Lautdenkmal mit @ = 1,0 [1,0-1,0], also ‚ungerundet‘ bzw. AC =0 
aus AC® = (0,0)"$ [0,0-0,0] bestätigt — es ist keine signifikante Distanz messbar. 

Wesentlich interessanter sind natürlich die Muster, in denen es darum geht, 
erwartete Unterschiede bzw. Abstände zu messen. Dies sind vor allem die langen 
A-Laute, für die eine deutliche Verdunklung erwartet wird. Für das altlange Ä 
(vgl. Abschnitt 9.4, S.306f.) und das Dehnungs-A: (vgl. Abschnitt 9.5, S. 319.) 
sollten sich signifikante Unterschiede zu der Kontrastgruppe der neutralen A fin- 
den lassen. Dies ist durchaus der Fall im Frankfurter Lautdenkmal: Es wird sowohl 
im Kontrastpaar [AA] als auch in [A A: ] jeweils ein signifikanter Abstand von 
AG = 0,7** [0,7-0,7] gemessen. Auch ist kein Unterschied beider Lautgruppen von- 
einander in dem Kontrastpaar [A Ar] mit AC = 0 aus AC® = (0,04)"® [0,00-0,06] 
feststellbar. Für A misst man mit ( = 3,3 [3,0-3,8] einen fast identischen Wert 
wie für Ar mit ( = 3,35 [3,29-3,48], welche beide nahe dem hochdeutschen ( = 3 
für den Laut [5] sind. Dies bestätigt das dunkle A, was in dieser Arbeit mit [a] 
notiert wird, als einen Mittellaut zwischen A und O, ganz gleich den Beschreibun- 
gen der Frankfurter Mundartforscher Oppel, Wülcker und Rauh'!*?. Dehnungs-A 
und altlanges A unterscheiden sich hingegen nicht untereinander: Im Kontrastpaar 
[Ar A] misst man mit Al = 0 aus Al? = (0,04)"® [0,00-0,06] keine Merkmals- 
differenz. Dieser Merger ist typisch für die Stadtmundarten der Zeit und Region. 
Er ist allerdings untypisch für die Landmundarten - im Zentralhessischen ist der 
Lautwert des altlangen Ä abweichend ein geschlossenes [or]. 


143 Hier sei nochmals darauf hingewiesen, dass das die Schreibung mit dem Zeichen (a) in dieser 
Arbeit phonetisch-phonologisch motiviert ist und nicht dem IPA-[a] entspricht. Der Lautwert ist 
etwa der des IPA-[5]. Man beachte auch, dass das Frankfurter O in der Regel den Lautwert [o] 
hat, womit [a], hier der Laut [5], zwischen [a] und [o] liegt (vgl. Abschnitt 9.2 ab S. 287). 
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Aber das dunkle A ist nicht überall erhalten und so entstehen Abweichungen 
zum Lautstand der Hauptperiode 4. Da sind zum einen lange A in neuen Begriffen 
aus der Hochsprache, wie z.B. in Nazi, hier Kontrastgruppe Ar-mod (vgl. Abschnitt 
9.7, 8.336 f.). Diese sind nicht mehr verdunkelt, was sich im VOKALJÄGER darin 
zeigt, dass kein Abstand, also AC = 0 aus AC? = (0,0)"5 [0,0-0,0], im Kontrastpaar 
|A»Ar-mod]| gemessen wird. 

Auch ist keine Verdunklung mehr in den A-Lauten zu messen, deren hochdeut- 
sche Äquivalente kurz sind und die auch im Frankfurterischen der Hauptperiode 
4 schon kurz waren oder kurz wurden, hier Kontrastgruppe kdA (vgl. Abschnitt 
9.7, S.336f.): Man misst mit AC = 0 aus AC’ = (0,0)"® [0,0-0,3] keinen signifi- 
kanten Abstand im Kontrastpaar [AkdA]. Der Merkmalswert der Gruppe kdA 
ist C = 4,0 [3,7-4,0], was den Werten der neutralen A entspricht. Das Frankfurter 
Lautdenkmal fällt in Hauptperiode 5, also mehr als 15 Jahre nach den Lautbe- 
obachtungen in Rauhs Lautlehre der Frankfurter Mundart. Schon dort vermerkte 
er, dass diese kurzen dunklen A-Laute im Verschwinden begriffen waren und in 
der ‚jüngeren‘ Generation nicht mehr vorkamen. Das aber ist genau das Muster, 
welches hier gemessen wird. 

Die Monophthongierung der alten Diphthonge EI und OU ist im Frankfurter 
Lautdenkmal durchgehend (vgl. Abschnitt 9.8, S.351f.). Es fehlt erwartungsge- 
mäß das Monophthongierungs-A von ÖU, das schon in Hauptperiode 4 fast aus- 
gestorben war. Im VOKALJÄGER misst man den vermuteten Zusammenfall aller 
Monophthongierungs-A mit dem neutralen A, also AC = 0 aus AC’ = (0,0)"° [0,0- 
0,0] im Kontrastpaar [A MA]. Entsprechend ist C = 4,0 [4,0-4,0]. Das nasalierte 
Monophthongierungs-A tritt im Frankfurter Lautdenkmal deutlich hervor: es gibt 
eine deutliche Distanz im Kontrastpaar [A MA-N]. Man misst hier ein Al = 1,5* 
[1,5-2,1] und in der Gruppe MA-N ein ( = 2,5 [1,9-3,8]. 

Von den zwölf getesteten Mustern entspricht das Frankfurter Lautdenkmal in 
neun dem, was man für das Frankfurterische der Hauptperiode 4 (1900-1925) er- 
wartet. Die beiden Abweichungen, die Entdunklung der gekürzten A (kdA) und die 
nicht mehr vorliegende Verdunklung junger langer A (Ar-mod), sind Vorboten des 
Untergangs des dunklen A, was sich dann in den Nachkriegsmessungen bestätigt. 


9.11.2 Wandel zum Neu-Frankfurterischen: Das REDE-Material 


Kann man dieselben Muster des Frankfurterischen in anderen und vor allem in jün- 
geren Tonproben aus Frankfurt messen? Dazu wurden verschiedene Tonaufnahmen 
analysiert, insbesondere aus dem REDE-Korpus. Ergänzt wurde die Untersuchung 
durch das Lautdenkmal aus Klein-Gerau. Eine exemplarische Übersicht und Zu- 
sammenfassung findet sich in Tabelle 57 auf S. 402. Der Sprecher FraF3L steht in 
dieser Tabelle repräsentativ für die meisten REDE-Sprecher, die sich wenig unter- 
scheiden und in dieser Tabelle nicht aufgeführt sind. Einzig der REDE-Sprecher 
FraFAlL wird separat dargestellt (die vollständigen Daten zu allen Sprechern fin- 
den sich in den einzelnen vorangegangenen Untersuchungsartikeln dieses Kapitels). 
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Der erste Test bezieht sich auf den qualitativen Zusammenfall der O-Laute in 
geschlossenem [o] bzw. [o:] (vgl. Abschnitt 9.2, S. 287 £.). Im Frankfurter Lautdenk- 
mal findet sich in [0x 0] nur die erwartete nicht signifikante Distanz. Genauso 
stellt es sich im Klein-Gerauer Lautdenkmal und beim REDE-Sprecher FraFAIlL 
dar - alle haben im Endeffekt Al = 0. Aber alle anderen modernen Frankfurter 
Sprecher trennen qualitativ kurzes und langes O, gleich dem Hochdeutschen mit 
seinem [5] und [or]. Entsprechend misst man eine signifikante Distanz mit AC > 0. 
FraLC z.B. hat AC = 0,9** [0,3-0,9] und FraF3L Ad = 1,0** [0,4-1,0]. 

Auch bei den ehemalig dunklen A-Lauten zeigt sich ein ähnliches Bild. Die 
Verdunklung des altlangen A, Gruppe A, und des Dehnungs-A, Gruppe Az, ist in 
FraLD, KG1 und FraFAlL gegenüber dem neutralen A, Gruppe A, deutlich mess- 
bar. Aber z.B. in FraLC und FraF3L findet sich keine signifikante Differenz mehr. 
Im Neu-Frankfurterischen hat sich ein Merger der langen, ehemalig dunklen A 
und der Gruppe A der kurzen neutralen A gebildet — beide Lautgruppen fallen im 
Lautwert [a] des neutralen A zusammen. Ebenso fehlt bei FraLC und FraF3L die 
Verdunklung in den verkürzten A (kdA), genau wie im Frankfurter Lautdenkmal. 
Hier gibt es nun Abweichungen bei KGl und FraFAlL: dort kann man im Kon- 
trastpaar [A»kdA]| noch ein AC = 1,0* [1,0-1,7| bzw. Ad = 1,0* [1,0-1,0] messen. 
Diese beiden Sprecher weisen hier einen Dialektstand auf, der, vom Muster her, 
dem Frankfurterischen gleich ist. 

Monophthongierungs-A hingegen ist durchweg häufig und fällt erwartungsge- 
mäß überall in dem Kontrastpaar [A>MA| mit dem neutralen A zusammen. In- 
teressant ist auch die Nasalierung: hier stellt sich die Frage, ob und wie stark das 
nasalierte Monophthongierungs-A vom neutralen A bzw. dem nicht nasalierten 
Monophthongierungs-A abweicht. Signifikante Abweichung von AG = 1,5* [1,5- 
2,1] im Kontrastpaar [AMA-N] gibt es nur im Frankfurter Lautdenkmal. In den 
anderen Sprachproben sind die Abstände entweder zu gering oder zwar vorhanden, 
aber nicht signifikant. 

Bei den meisten der hier tabellierten Sprechern zeigt sich Entrundung bzw. 
fehlende Rundung, ganz gleich dem Frankfurter Lautdenkmal'*. Die Sprecher 
FraF2L, FraF4L, FraFA2L und FraFJl, die hier nicht aufgeführt wurden, sind 
allerdings kaum entrundet (vgl. Tabelle 55 auf S. 397). 

Zusammenfassend lässt sich sagen, dass die Sprecher des REDE-Materials, mit 
Ausnahme von FraFAIL, keine Lautmuster mehr aufweisen, die ein dem Hoch- 
deutschen fremdes Lautinventar benötigen. Das ist insbesondere die Verdunklung 
des langen A, die ein [a:] benötigt, das es im Hochdeutschen nicht gibt — das qua- 
litativ dem [a] sehr ähnliche [5] kommt nur als kurzer Laut vor. Auch benötigt das 
Dialektmuster des Zusammenfalls der O-Laute ein kurzes geschlossenes [o] — die 
Hochsprache hat nur die lange Version [o:]. Das Gleiche gilt für das lange nasalier- 


144Rine Besonderheit ist FraF3L, der zwar im Kontrastpaar [Üx © I: ] gleich allen anderen nicht 
signifikante Abstände bzw. Al = 0 aufweist, woraus sich aber in diesem Fall keine numerische 
Dialektalität 9 > 0 erschließt: Die hinreichende Bedingung, dass nämlich d im Zielband — 1 
liegt, ist nicht erfüllt (vgl. Abschnitt 9.10, S. 385 f.). 
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te [ar]. Die anderen hier aufgeführten Lautmuster des Frankfurter Stadtdialekts, 
das Monophthongierungs-A und die Entrundung, lassen sich mit dem Lautinven- 
tar des Hochdeutschen modellieren: es wird nur ein [a:] bzw. [i:] oder [e:] benötigt. 
Vermutlich ist das die Regel: Es verschwanden im Neu-Frankfurterischen die dem 
Hochdeutschen fremden Laute [az], [o] und [ä:] und so die damit verbundenen 
Dialektmuster. Muster, die mit hochdeutschen Lauten gebildet werden können, 
bestehen eher weiter fort und sind heute zum Teil noch messbar. Das Neu-Frank- 
furterische hat nach wie vor dialektale Muster, doch ist es vom Lautinventar her 
nun dem Hochdeutschen gleich geworden. 

Was ist nun mit FraFA1L? Ist dies ein prototypischer übriggebliebener Ur- 
Frankfurter? Auf den ersten Blick erfüllt FraFAlL viele der ideelen Frankfurter 
Dialektmuster, aber der Schein trügt: So verdunkelt altlanges A zu stark, es hat 
[o:]-Charakter, denn im Kontrastpaar [A>-0:] kann, anders als bei allen anderen 
Sprechern und insbesondere dem Frankfurter Lautdenkmal, kein signifikanter Ab- 
stand gemessen werden. Wie schon in Abschnitt 9.4.4, S.315f., erwähnt, ist aber 
ein altlanges A, das zum [o:] wird und nicht [a:] bleibt, ein Zeichen des Zentral- 
hessischen, nicht aber des Frankfurterischen. So bleibt zu vermuten, dass FraFAIL 
eher Hessisch und nicht Frankfurterisch spricht bzw. zentralhessisch geprägt ist. 


9.11.3 Abschließende Beschreibung des Frankfurter Lautwandels 


Mit dem VOKALJÄGER konnte eine Indikation gegeben werden, wie sich der Frank- 
furter Stadtdialekt zwischen Phase 4 (1900-1925) und 5 (1925-1945) sowie der 
Nachkriegszeit bzw. dem Neu-Frankfurterischen entwickelt hat. War insbesondere 
im Frankfurter Lautdenkmal — völlig übereinstimmend mit den Beobachtungen 
Rauhs - noch eine Verdunklung des langen A-Lauts messbar, so ist dieses Phä- 
nomen im Neu-Frankfurterischen des REDE-Materials nicht mehr auffindbar'®. 
Andere Phänomene, wie z.B. die Entrundung oder das Monophthongierungs-A 
bleiben — zumindest teilweise — erhalten. Die zusammenfassende Abbildung 116 
auf S. 405 stellt exemplarisch für das dunkle bzw. entdunkelte A und die runden 
bzw. entrundeten Vorderzungenvokale die mit VOKALJÄGER gemessenen und er- 
kannten Lautwandelvorgänge dar. 

Wie aber steht es um die anderen Hauptphasen? Was ist die Entwicklung des 
Frankfurterischen im 19. und frühen 20. Jahrhundert? Dazu müssen die Schrift- 
belege Rauhs, Wülckers und Oppels mit den Messungen des VOKALJÄGERS ver- 
glichen werden. Abbildung 117 auf S. 407 fasst abschließend alle Erkenntnisse, die 
so über die ausgewählten Phänomene gewonnen werden können, zusammen. In 
diesem Abschnitt soll der Fokus der Erläuterung auf den Hauptperioden 1 bis 4 
liegen, was dem Zeitraum von etwa 1825 bis 1925 entspricht. Im Wesentlichen ist 
das Lautbild insbesondere zwischen Hauptperiode 2 (1850-1875) und davor sowie 
Periode 4 (1900-1925) stabil: Oppels Notizen bestätigen Rauhs Beobachtungen. 
Das gilt insbesondere für das Monophthongierungs-A, mit der Ausnahme der ÖU- 


145 Wenn man FraFA1L als Nicht-Frankfurter zählt (vgl. S. 404). 
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Abbildung 116: Mit dem VOKALJÄGER gemessener Lautwandel des Frank- 
furterischen (in Auswahl): Merger des dunklen und des neutralen A (links) so- 
wie Split der Vorderzungenvokale hinsichtlich Rundung (rechts). Die x-Achse ordnet 
nach Hauptperiode und Dialekt von links nach rechts: Frankfurter und Klein-Gerau- 
er Lautdenkmal von 1937 (Fra-5; KG-5), REDE-Sprecher der älteren und jüngeren 
Generation (Fra-6; Fra-7) und Hochdeutsch (HD). Die obere Reihe dokumentiert 
die originäre Merkmalsdifferenz AC pro Sprecher und Lautmuster (vgl. Abschnitt 
5.2.2.1, S.187£.), die mittlere die numerische Dialektalität ® (vgl. Abschnitt 5.2.2.3, 
S.188f£.). Binär dialektale Muster (vgl. Abschnitt 5.2.2.2, S. 187 £.) sind mit schwarzen 
Symbolen markiert (Legende: Marke ,J‘). Die untere Reihe weist ihren ausgezählten 
Anteil aus und die Linie verbindet die Mittelwerte. Der horizontale Strich zeigt die 
Werte eines ideellen Frankfurterischen der Hauptperiode 4 (1900-1925) an. —A- 
Laute (links): AC® wird bezüglich der Öffnungsstufe der Hinterzungenvokale in den 
Kontrastpaaren aus neutralem A je auf der einen Seite und altlangem A, Dehnungs-A: 
sowie kurzem dunklen A, kdA, auf der anderen Seite bestimmt. In Fra-5 und KG- 
5 werden deutlich von Null abweichende Merkmalsdifferenzen AC® und numerische 
Dialektalitäten 9 gemessen: dunkles A und neutrales A sind lautlich-qualitativ ge- 
trennt. In den jüngeren bzw. hochdeutschen Proben sind die AC® und ® deutlich 
geringer und der Anteil der dialektal markierten Proben sinkt entsprechend: Der 
dunkle A-Laut hat aufgehört zu existieren und ist mit dem neutralen A in einem 
Merger zusammengefallen. —Vorderzungenvokale (rechts): AC® wird bezüglich des 
Rundungsgrads der langen Vorderzungenvokale in Kontrastpaaren aus ungerundeten 
und hochdeutsch runden Lauten errechnet. In Fra-5 und KG-5 misst man verschwin- 
dend geringe AC”, was von einem Zusammenfall im Zustand der Entrundung zeugt. 
In den jüngeren bzw. hochdeutschen Proben verschwindet die Entrundung und man 
beobachtet nun einen Split in den runden und ungerundeten Zustand. Entsprechend 
sinkt die numerische Dialektalität ® und der Anteil der dialektalen Muster. — Für 
andere Kontrastpaare ergeben sich andere Statistiken, aber ähnliche Muster. 
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Monophthongierung, deren Aussterben in diese Zeit fällt, z.B. für Freude, [fra:t]? 
— [frort]*. Allerdings hat sich der Lautwert wahrscheinlich leicht von einem palata- 
lerem [a:]? zu einem neutralen [a:]* hin verschoben. Entrundung liegt unverändert 
über alle Perioden vor und der Zusammenfall der O-Laute galt bis Hauptperi- 
ode 4. In Periode 4, also ab etwa 1925, setzt der schon in vorherigen Abschnitten 
beschriebene deutliche Wandel zum Neu-Frankfurterischen ein. 

Hinsichtlich der A-Laute findet der deutlichste Wandel statt. Zum Ersten war 
wohl allgemein der Klang des langen A im 19. Jahrhundert dunkler, also [»:]? 
— [ar]*. Dies kann allerdings leider nicht in Real-Time belegt werden — der Schlüs- 
sel ist die Apparent-Time-Differenz, die Rauh zur älteren Generation hin, also von 
Hauptperiode 4 (1900-1925) zu Periode 3 (1875-1900), hörte. Aus den Reliktwör- 
tern für blau und grau, die im Frankfurterischen [o:] hatten, also [plo:]? und [kro:]? 
lauteten, mag man ansetzen, dass altlanges Ä im Frankfurterischen einstmals [o:] 
war. In ähnliche Richtung gehen [hot]* und [host]? für hat und hast aus altem hät 
und häst — andererseits hatten gerade letztere Wörter immer daneben noch [a]- 
Formen, also [hat]? und [hast]. Doch auch das muss Hypothese bleiben, da aus 
der Zeit vor 1800 keine phonetisch exakten Beobachtungen existieren. In seiner 
Gesamtheit machte das lange A wohl den Lautwandel [5:1]? — [a:]* — [a:]® durch, 
2.B. für fragen |froryo]? — [fraryo]! — [fraryo]®. Für das altlange Ä ging vielleicht 
einst im Mittelalter noch ein ursprüngliches [o:]' voran. Der letzte Stand, der dem 
Hochdeutschen gleiche Klang mit [a:]°, zeigt sich schon im Frankfurter Lautdenk- 
mal in der Gruppe Ar-mod der jungen langen A, z.B. [na:tsi]? für Nazi anstatt 
[*na:tsi]. Der Lautwert mit langem neutralen [a:] ist das, was man in den jüngeren 
Tonaufnahmen misst. 

Schon viel früher beim hochdeutschen [a] angekommen waren kurze A, die 
auf alte lange A zurückgehen. Die Muster hier sind wohl [5]? — [a]* — [al’, z.B. 
für ich habe [hap]® — [hap]* — [hap]® und [:])? — [ar]? — [a]? — [a], z.B. für 
Garten [9:do]? — [ga:do]? — [gado]* — [Yado]. Die Begründung für den kurzen 
dunklen A-Laut ist wohl, dass A an dieser Stelle einstmals lang und damit dunkel 
war und dann verkürzte. Der Merger der dunklen A mit den neutralen A ist das 
Wesensmerkmal des Untergangs der Frankfurter Stadtmundart. 

Doch besonders interessant sind die vereinzelten Bewegungen, die sich nur aus 
dem Blick auf das große Ganze ergeben: das sind die Lautbilder, die zwischen Op- 
pels Periode 2 (1850-1875) und Hauptperiode 4 (1900-1925) völlig unterschiedlich 
sind, so dass Rauh schon keine Apparent-Time-Bewegung mehr von der alten Ge- 
neration her erkennen konnte. Dazu gehören einzelne dunkle kurze A vor -T. Hier 
fand die Kürzung und der damit einhergehende Verlust der A-Verdunklung schon 
so früh statt, dass Oppel ihn nur noch in Apparent-Time beobachten konnte. Zwei 
Beispiele sind Blatt mit [plaxt]! — [plot]? — [plat]* oder glatt mit [klot]! — [klat]?. 
Im VOKALJÄGER sind kurze dunkle A gänzlich nicht mehr nachweisbar für Frank- 
furter Lautproben, gleich welchen Datums. 

Die Untergruppe alt, kalt und bald ist das prototypische Beispiel für eine Vo- 
kalwandelanalyse in Real-Time. Seit Ende des 18. Jahrhunderts liegen belastbare 
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Beobachtungen aus der jeweiligen Periode vor: Für Hauptperiode O bis 1, also vor 
1825, ist es die Mundartliteratur, die hier präzise Quelle für kurzes A mit Verschluss 
ist. Dies wurde auch so von Oppel in Hauptperiode 2 Mitte des 19. Jahrhunderts 
bestätigt: [alt, balt, k®alt]?. In Hauptperiode 3 hörte Wülcker um 1877 schon [5:1] 
und [ba:l]? für alt und bald — der Verschluss war verschwunden und das A erschien 
nun lang und dunkel. In Rauhs Hauptperiode 4, dem Beginn des 20. Jahrhunderts, 
war die Leitform [a:l]? und [k"a:l]? für alt und kalt, beide mit langem dunklen [a]. 
Daneben existierten aber schon [a:l]? und [kFa:l]* mit langem neutralen [ar]. Letz- 
tere Formen mit [a:] sind die des Zentralhessischen, aus denen das Frankfurterische 
wohl die Formen Ende des 19. Jahrhunderts übernommen hat und kurzfristig, an- 
gelehnt an das dunkle Dehnungs-A, verdunkelte. Der späte Rauh vermerkte für 
Hauptperiode 5 (1925-1945) ein [kPa:l])® für kalt. Im Neu-Frankfurterischen des 
21. Jahrhunderts ist bald wieder [balt] bzw. [balt] geworden aber es gilt immer 
noch [a:l] und [karl]. Der Lautwert der letzten Formen als neutrales A kann im 
VOKALJÄGER mit 6 #4 bzw. AG = 0 in der Kontrastgruppe [A»A-1t] bestätigt 
werden. 


Durch die Vielheit der Quellen im Frankfurterischen und das empirische Messin- 
strument des VOKALJÄGERSs konnte eine zwei Jahrhunderte umfassende Real-Ti- 
me- Untersuchung durchgeführt werden, die klassisch-phonologisches Arbeiten mit 
moderner Klassifikationsphonetik kombiniert. 
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Nicht verschwiegen werden sollen all die anderen Vokale des Frankfurterischen, 
die theoretisch ebenfalls mit der Methode des VOKALJÄGERSs untersucht werden 
könnten, aber hier keinen Eingang gefunden haben. In der Regel sind sie nicht 
distinktiv-definierend für den Frankfurter Stadtdialekt bzw. im Lautstand dem 
Hochdeutschen gleich, sie fallen nicht in den Anwendungsbereich der für den VO- 
KALJÄGER abschließend kalibrierten gleitenden Merkmale, der Öffnungsstufe der 
Hinterzungenvokale und des Rundungsgrads oder aber die Beleglage, insbesonde- 
re im Frankfurter Lautdenkmal, ist dünn. So verbleibt auch in dieser Arbeit das 
gleitende Merkmal der Öffnungsstufe der Vorderzungenvokale ungenutzt. 

Im Folgenden sollen deshalb vollständig alle Vokale des Frankfurterischen in 
einer Referenz zusammengestellt und in einem lauthistorischen Kontext kurz erläu- 
tert werden!*®. Eine Übersicht mit Zuordnung zu den erschlossenen IPA-Lautwer- 
ten und zu den Referenzlauten des normalisierten Mittelhochdeutsch findet sich in 
Tabelle 58 auf S. 412 (vgl. auch Abschnitt 7.5 ab $. 264 zur Systematik). Falls noch 
keine Belege im Hauptteil behandelt wurden, ist hier eine kleine Auswahl beige- 
legt. Es wird das klassische Ordnungsprinzip des Mittelhochdeutschen angewendet, 
wobei alphabetisch sortiert ist und die Umlaute den Bezugsvokalen nachgestellt 
sind. So nicht anders angegeben, handelt es sich um den in Rauh (1921a) niederge- 
schriebenen Lautstand aus Hauptperiode 4, also um das klassische Frankfurterisch 
von 1920. Wird keine Hauptperiode explizit angegeben, ist der Lautstand über alle 
Perioden gültig, sonst sind Perioden mit hochgestellter Ziffer angezeigt. 


9.12.1 Das Lautinventar der Frankfurter Vokale 


1. Die A-Laute — Dem Frankfurter kurzen neutralen A mit dem hochdeutschen 
Lautwert [a], z.B. in Sack, [sak], stand das verdunkelte A gegenüber, das in 
Hauptperiode 3 den Lautwert [5] hatte. In Periode 4 war es mehr zum A geneigt, 
was hier mit dem Lautzeichen [a] angezeigt wird, z.B. in Achsel, [aksl]* und 
Naht, kFra. [na:t]* (zu Details vgl. Abschnitte 9.3 [S. 297 £.], 9.4 [S. 306 f.] und 
9.7 |S. 336 £.].). Das für den Frankfurter Stadtdialekt charakteristische dunkle 
A kommt im Hochdeutschen nicht vor bzw. hat in der Länge kein lautliches 
Äquivalent (für die Kürze ist es [D]). Das neutrale A in der Länge, [a:], war der 
Lautwert des Monophthongierungs-A in Periode 4, z.B. in Frau, [fra:]! und 
entspricht hochdeutsch langem A (zu Details vgl. Abschnitt 9.8, S. 351f£.). 


146Prinzipiell nicht im Fokus des VOKALJÄGERSs stehen Diphthonge — der Vollständigkeit hal- 
ber sind sie ebenfalls hier aufgeführt (vgl. auch Anmerkungen zur Lautung im Hochdeutschen 
in Fußnote 8 auf S.30). Halb- und Reduktionsvokale sind nur am Rande erwähnt. Vokale aus 
französischen Lehnworten, eingedrungen in das Frankfurterische nach den vielen Besatzungen, 
sind genauso ausgelassen wie solche aus hebräisch-jüdischen Wörtern. Zu den Konsonanten vgl. 
Fußnote 104 auf S. 268. 
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Weiterhin existierte noch ein palatisiertes bzw. helles A, [a/a:], etwa mit 
dem Lautwert des kurzen französischen /a/'!”. In Hauptperiode 2 war dies in 
der Länge [a:] der Lautwert des Monophthongierungs-A, z.B. in Frau, [fra:]? (zu 
Details vgl. Abschnitt 9.8.1.3, S.356f.). In Hauptperiode 4 kam es vereinzelt 
kurz in der Jugendsprache vor, z.B. in Wurst, [vaft]°. Das ältere [a:] ist phone- 
misch; das jüngere [a] scheint allophonisch gewesen zu sein, da es auf ehemalig 
zu [>] geöffnete U und OÖ vor -RT/-RST zurückgeht. 


Ebenfalls sehr prägend für die Frankfurter Mundart war das lange, stark 
nasalierte und dunkle A vor N, [ä:], z.B. in Bein, [ba:]. 


Weder [a/a:], [a/a:] noch [ä:] existieren im Hochdeutschen. 


2. Die Ä- und E-Laute — Offenes E bzw. Ä war im Frankfurtischen [e/e:], 
2.B. in Äcker, [eg&], und Träger, [tre:3&]. Während das Hochdeutsche diese 
Laute auch kennt, hatte das Frankfurterische mit [e/a:] noch zusätzlich allo- 
phonisches überoffenes Ä bzw. E vor historischem -R, z.B. in Herz, [haexts], 
und Bär, [baere]!“®. Ein weiteres Frankfurter E war geschlossenes [e/er], z.B. 
in Bett, [bet], und Klee, [kle:] (zu Details vgl. Abschnitt 9.10, S.385f.). Das 
Hochdeutsche kennt nur die Länge [e:] (RAu: 41). 


Während [e/e:] „geschlossen“ klang, war [e/e:] weiter geöffnet und wies „eine 
wesentlich weniger straffe Muskulatur auf‘. Das „wesentlichste Merkmal“ von 
überoffenem E, also [&/ze:], im Vergleich zu offenem E, [e/e:], war aber „die 
größere Öffnung des Mundes“ (Rau: 41.1, 2 und 3). 


Darüber hinaus gab es im Frankfurterischen —- und gibt es ebenso im Neu- 
Hessischen — ein unbetontes Ä, das überoffene überkurze [&#], das sich „nur 
in schwach und unbetonten Silben“ fand und in der Regel auf die vokalisierte 
Endsilbe -ER zurückgeht, z.B. in älter, [eld&]: „Die Hebung der Zunge ist noch 


geringer als bei (a2), jedoch ist der Mund nicht so weit geöffnet“ (RAu: 41.3). 


Rauh unterschied zwischen geschlossenem E, seinen (e/®), und den offenen 
und überoffenen E-Lauten, seinen (e/&) bzw. (&x/&). Bei Oppel ist die Unter- 
scheidung weniger fein: er trennt nur geschlossene (&/e) von offenen (ä/ä), wobei 
Buchstabe und Längenbezeichner weniger relevant sind als die Vokalnummer 
4 bzw. 3. Rauh entwirft in den Zuordnungen zu den historischen Lautgruppen 
— vgl. hier Abschnitt 9.12.2, S. 413f., und folgende — eine vermeintlich syste- 
matische und stimmige Ordnung. Dies deckt sich allerdings nicht immer mit 
den Beobachtungen Oppels, aus denen sich ein wesentlich unregelmäßigeres 
Bild ergibt. Möglicherweise sind Rauhs Beschreibungen an die Erwartung einer 
Systematik angeglichen, denn er kannte die historischen Lautgruppen — Oppel 
hingegen nicht. In diesem Abschnitt wird Rauhs Systematik gefolgt und Oppels 
Belege werden ergänzt. 


147 Vgl, hierzu auch Fußnote 131 auf $. 356. 
148 Das Symbol [a2] soll den stark geöffneten Ä-Laut beschreiben und ähnelt dem IPA-[z2]. Al- 
ternativ hätte man auch [eg] schreiben können. 
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3. Die I-Laute — Das frankfurterische I war geschlossenes [i/ir], z.B. in Fisch, 
[fif], und Stiel, [fdi:l|(zu Details vgl. Abschnitt 9.10, S.385 £.): in „beiden Fällen 
geschlossen“ (RAU: 40). Das Hochdeutsche hat hingegen [ir] und offenes [r]. 


4. Die O-Laute — Das frankfurterische O in Normalposition war geschlossenes 
[o/o:], z.B. in klopfen, [kloba], und Bogen, [bo:ya]: „(o) klingt ebenso geschlos- 
sen wie ()“ (RAU: 43.3). Das Frankfurterische hatte darüber hinaus noch die 
geöffneten O vor R [5/>r], z.B. in Wort, [voet], und Zorn, [tsoren], sowie nur 
langes [o:] vor R und Konsonant, z.B. in Tor, [dore](zu Details vgl. Abschnitt 
9.2, S. 287f.). 


Für [5/>:] war „die Hinterzunge geringfügig stärker gehoben“ als bei [a/ar], 
aber vor allem nun mit Rundung der „gespannten Lippen“ gesprochen. [o:] lag 
als „halboffener o-Laut zwischen“ [5] und [o] (RAu: 43.3). 


Das Hochdeutsche kennt nur [5/or], also mit offenem [>] in der Kürze anstatt 
des geschlossenen [o] des Frankfurterischen. 


5. Die U-Laute — Das frankfurterische U war geschlossenes [u/u:], z.B. in But- 
ter, [bud&], und Jugend, [jurynt]. Das Hochdeutsche kennt nur die Länge [ur], 
die Kürze hat offenes [u]. Vermutlich zeigte die Mundart um 1920 schon den 
Wandel hin zu einem kurzen offenen [v]: „Zuweilen wird die Kürze (u) mit et- 
was geringer Hebung der hinteren Zunge gebildet, deren Muskulatur weniger 
gespannt ist als beim (ü). |...| Beide Laute unterscheiden sich jedoch nicht in 
ihrem Klang, der geschlossen ist“ (RAU: 44). 


6. Die Ü- und Ö-Laute — Der Frankfurter Dialekt war entrundet. Somit fehlen 
die hochdeutschen U- als auch O-Laute [y:/v] bzw. [e:/ce] (zu Details vgl. 
Abschnitt 9.10, S.385£.). 


7. Die Diphthonge — Das Frankfurterische hatte die drei Diphthonge [ar], [av] 
und [or], bei Rauh (ai), (au) und (oi), z.B. in Beil, Maus und heute mit [baıl], 
[mavs] und [hort]. Die I- und U-Laute der zweiten Komponente sind „weiter, 
die Zunge wird nicht so hoch gehoben, so daß ein nach (e) neigendes (i) und 
ein nach (o) neigendes (u) gesprochen wird“ (RAu: 47.2). [ar/av] sind identisch 
mit dem Hochdeutschem. [or] unterscheidet sich dergestalt, dass die erste Kom- 
ponente geschlossener und die zweite entrundeter erscheint als das kanonische 
[>v]'*?. Bestimmte [or]? sind vermutlich jüngerer Natur und über [>]? aus einem 
[far] Anfang des 19. Jahrhunderts entstanden (vgl. hier Punkt 8 auf $. 423). 


8. Die Schwavokale — Vokalisiertes R war ein unsilbisches A-Schwa, [e], z.B. 
in Wurst, [voeft], gleich dem Hochdeutschen'”®. Das E-Schwa [o], ebenso vor- 
handen im Hochdeutschen, stand für unbetontes E, z.B. in getan, [godä:]. 


14971 den Diphthong-Notationen des Hochdeutschen vgl. Fußnote 8 auf S.30. 
150n Hauptperiode 4 wurde [e] insbesondere nach langen [z:/>:] nicht mehr durchgehend ge- 
sprochen, was Rauh mit dem Zeichen (R]) beschrieb. 
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Kurze Vokale 


1 i Gl  1/ü/ie/ür u (ulü)  u/Vo 
20 e dkeld)  R/ö/h/n/d 0 (old) 0/6 

3 e (elä) A/E 3a: (all) ArfÄ 
4 a (ala) A 


Lange Vokale 


1 x Al)  n/Ür/IE/ÜE u (ülu) ur/vo 
3 e dele) Ei/ö/E/E/E oı (616) or/ö 
3 ei. ‚(e]la), Afkı at (Alf) Ar/A 
4 a2 (Halafä) — a? (al-)  Ei/ou/öu 


Allophone vor R und N sowie Schwavokale 


2 5) (ale) 

2; 010)  w/orn 

3 x (yelır) » (018)  u/o-RC 
„a (18)  w/or-RC 


35 8 c(äler) -ER# 
& (&|ä) i/e/e vor -R 
a: (&|ä)  ir/er/er vor -R 
4 a®  (a|-)  u/o vor -RT/-RST (vereinzelt) 
Diphthonge 
a ee a (ala) io 
av (aulau) Ü 
*a (*ailtai) — ? (leid) — of del) m 


Tabelle 58: Das Lautinventar des klassischen Frankfurterischen um 1920. Gedruckt 
ist die Öffnungsstufe 1-4; der angesetzte IPA-Lautwert; in ()-Graphemklammern das 
übliche bzw. kanonische Schriftzeichen Rauhs (links) sowie das Oppels (rechts) und 
abschließend in Kapitälchenschrift der Laut des normalisierten Mittelhochdeutschen, 
der in der Regel zugrunde liegt. Lautwandel zwischen Hauptperioden (hochgestellte 
Ziffern) wird mit — angezeigt. Die phonemisch-phonetische Struktur ist für Kurz- 
als auch Langvokale ein vierstufiges Dreieck ([a:] und [a:] traten nicht synchron auf). 
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9.12.2 Die altkurzen Vokale 
1. Mhd. altkurzes A 


(a) Kurz gebliebenes A (vor allem in geschlossener Tonsilbe) —kFra. kur- 
zes neutrales [a], z.B. in Affe mit [af] (RAu, 90.1; für eine ausführliche 
Darstellung vgl. Abschnitt 9.3 ab S. 297). Dieser Lautstand ist gleich dem 
Hochdeutschen. 


(b) Altkurzes A vor -LT — kFra. im Allgemeinen kurzes neutrales [a], z.B. 
in Salz mit [salds]. Dieser Lautstand ist gleich dem Hochdeutschen. Aus- 
nahmen sind alt, bald und kalt, die im späten 19. Jahrhundert zentralhes- 
sischen Lautstand annahmen: [alt, balt, kPalt]®? — [>ıl, barl, Kto]? — [al, 
ba:l, kta:l]? —[a:l, ba:l, kPa:l]? (Rau, 90.1, Anm. 4; für eine ausführliche 
Darstellung vgl. Abschnitt 9.9 ab $. 375). 


(c) Kurz gebliebenes A vor Nasal — kFra. kurzes dunkles [a]*, z.B. in 
Handel mit [hanl] (Rau: 90.2.a). Die hier beschriebene Verdunklung betrifft 
kurzes A vor den Konstellationen [-n/m/y/yk/nl/ml). 


Rauhs Beobachtungen eines dunklen [a] in Periode 4 decken sich aller- 
dings nicht mit denen von Oppel aus Periode 2, der durchweg und explizit 
neutrales [a]? vor diesen Nasalen notierte. So hörte Oppel z.B. [man]? für 
Mann, während Rauh ein dunkles [man]? beschrieb. Dasselbe neutrale A 
beobachtete auch Wülcker. Vermutlich setzte im Frankfurterischen vor Na- 
sal eine Verdunklung [a]? — [a]* ein, womit ein Lautstand erreicht wurde, 
der dem im Südhessischen nördlich von Darmstadt ähnelte (Bo: 195). 


Das Frankfurter A ist hier unterschiedlich zum Hochdeutschen, welches 
an dieser Stelle neutrales [a] hat. Aus dieser interessanten Lautkonstellation 
lagen leider für den VOKALJÄGER keine ausreichenden Proben vor. 

Belege: ® Anke (Genick). (anke). > [ayk]*: Rau, 90.2.a: ank. — » Band. 
(bant). > [bant]: OPF?, 1.19.9: Band: &. © Umlaut: Bändel (bendel): » [ben]]: Rau“, 
97.1: benl. — » Bank. (banc). > [bayk]”: OPF?, 1.19.9: Bank: ä. — » Frankfurt. 
(Frankenvord). > [frayfoet]*: Rau“, 195.c: frapfo*t. — » Gans. (gans). > [Qands]”: 
OPrZ?, 1.19.9: Gans: ä. OPZ?, 1.47.2: Gäns. D [gands]*: Rau, 209: gands. & Umlaut: 
Gänsi, Dim.: » [denzi:]: OPZ?, 1.47.2: gensi. Rau*, 160.1: gensi. » [e]’: RauZ?, MW: 
g&ns. — ®» Hand. (hant). > [hant]’: OPF?, 1.19.9: Hand: ä. > [hant]*: Raut, 176: 
hant. & Umlaut: Hände (hende): » [hent]?: OPZ?, 1.23.3: Hend, Henn. OP2?, 11.1.56.10: 
Henchevoll (Handvoll: Rau“, 97.1: hent. Rau“, 97.1: henso (Handschuh). — » Handel. 
(handel). D [hanl]*: Rau“, 90.2.a: hanl. — » Kamm. (kamp). > [k"am]?: OPF?, 
1.24.5: Konstant [...] Kämm. Niemals |...] Kamm. > [k"am]*: RAu?, 90.2.a: kham. & 
Umlaut: Kämme, gekämmt (kemb, gekempt): » [ktem]?: OPZ2, 1.28.7: Kemmkämm. © 
Sachsenhausen: D [»:]: OPZ?, 1.24.5: Kämm. — » Kammer. (kamen). D [Kramz]?3: 
OPF°, 1.19.8: Kammer: ä. Woürs, 29: khammer. > [kPamz#£]*: Rau“, 204.2.a: khamä. 
— » Klammer. (klamer). > [klamss]?: OPF°?, 1.19.8: Klammer: ä. Wwör3, 29: klam- 
mer. > [klam&]*: Rau“, 204.2.a: klamä. — » Pflanze. (pflanze). D [plands]*: Rauf, 
66.b: plands. & Umlaut: Pflänzi, Dim.: » [plenzi:]: Rau, 98.2: plensi. — ® Kranz. 
(krants). > [krants]: 1.19.9, OpF: Kranz: &. RauZ*, MW: eblwäkrands. — » Mann. 
(man). > [man]®*: OPF?, 1.19.9: Mann: &. BAT?: Mann (nicht als ä geschrieben!). > 
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man]: Rau?, 90.2.a: man. — » Stamm. (stam). > [dam]: OPF?, 1.19.8: Stamm: 
&. D [fdam]*: Rau?, 90.2.a: Sdam. 

(d) Gedehntes A: (vor allem in offener Tonsilbe oder in Analogdehnung zu 
obliquem Kasus) — kFra. langes dunkles A bzw. [5:]? — [a:]?, das im Neu- 
Frankfurterischen zu [a:]° entdunkelt, z. B. in mahlen mit [ma:lo]? — [marlo]? 
— [ma:lo]® (Rau, 90.3; für eine ausführliche Darstellung vgl. Abschnitt 9.5 
ab $S.319). Dieser Lautstand steht in Opposition zum Hochdeutschen, das 
hier [a:] hat. 

(e) Gedehntes A: vor Nasal (vor allem in offener Tonsilbe oder in Analog- 
dehnung zu obliquem Kasus) — kFra. langes dunkles [a:] mit Tendenz zur 
Nasalierung insbesondere vor abschließendem -N, aber nicht durchgehend; 
z.B. in Zahn mit [tsa:] (RAU, 90.3; für eine ausführliche Darstellung vgl. 
Abschnitt 9.5 ab S.319). Dieser Lautstand steht in Opposition zum Hoch- 
deutschen, das hier [a:] hat. 


(f) Rückverkürztes gedehntes A: (so etwa vor -HS/-HT) — kFra. kurzes 
dunkles A bzw. [5]? — [a]*, das zu [a]? entdunkelt. Der Verkürzungs- bzw. 
Entdunklungsprozess setzte in verschiedenen Perioden ein, endete aber spä- 
testens in Hauptperiode 5 immer in einem neutralen [a], z.B. in Blatt 
mit [ploxt]' — [plot]? — [plat]? oder Warte mit [vart]? — [vart]* — [vat]‘ 
— [vat]? (Rau, 90.2.b-d, 90.3; für eine ausführliche Darstellung vgl. Ab- 
schnitt 9.5 ab S.319). Dieser Lautstand steht in Opposition zum Hochdeut- 
schen, das hier [a] hat. 


2. Mhd. altkurzes primäres Umlaut-E 


(a) Kurz gebliebenes E (vor allem in geschlossener Tonsilbe) —kFra. ge- 
schlossenes kurzes [e], z.B. in Gäste mit [gest] (Rau: 97.1). Auch Oppel 
hörte hier geschlossenes E, was er z.B. in (Gens) für Gänse notierte. In 
diesem Fall tritt das Frankfurterische in Opposition zum Hochdeutschen, 
das hier [e] hat. Allerdings war der Zustand in Hauptperiode 5 schon in 
Auflösung und eine Ausgleichsbewegung von z.B. [bet]! — [bet]? für Bett 
setzte sich durch (RAU: 18). 


Belege: » älter. (elter). > [eld&]: vgl. alt, S. 378. — » Bändel. (bendel). > [ben]]: 
vgl. Band, S. 413. — » Bengel. (bengel). > [beyl]: OPZ?, 1.47.11: Bengel. Rau®, 97.1: 
bel. — » besser. (bezzer). > [bezi£]:. RAU“, 97.1: besä. — » Bett. (bette). > [bet]?: 
OPF?, 1.31.13: Bettbeziech (Bettbezüge). > [bet]*: RAut, 97.1: bet. > [bet]’: Rauf, 
18: bet. — » fest. (veste). > [fest]: RAu*, 97.1: fest. — » Gäste. (geste). > [gest]: 
Raut, 97.1: gest. — » hältst. (heldest). > [heldst]: vgl. halten, S. 378. — » Kälber. 
(kelber). > [kPelv&]: vgl. Kalb, S. 300. — » Mensch. (mensche). > [mendJ, men39]: 
OPZ?, 1.26.14: Mönsch. RAu?, 170.1.b: mends. Rau?, 170.2: mens. 


(b) Kurz gebliebenes E vor historischem -R — kFra. kurzes überoffenes E, 
also [&], z.B. in Gerte mit [gaeet] (R.Au: 97.2). Dieser Lautstand ist dem 
Hochdeutschen ähnlich, wobei die Öffnung im Frankfurterischen tendenziell 
größer ist. 
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Belege: » Erz. (erz). > [eets]: Rau“, 97.2: a*tsgaunä (Erzgauner). — » Gerte. 
(gerte). & [dzeret]*: Raut, 211.2.a: galt. > [Geeet]’: Rau, 211.2.a: galt, „unter 
schriftsprachlichem Einfluß die Verkürzung“. 

(c) Gedehntes E: (vor allem in offener Tonsilbe) —kFra. langes geschlosse- 
nes [er], z.B. in heben mit [hervo] (RAu: 97.1). Dieser E-Lautstand ist für 
lexikalisierte Umlaute oft dem Hochdeutschen gleich, z. B. nhd. Esel, [e:zl], 
kFra. [e:zl], weicht aber für produktive A-Umlautung z.B. in nhd. Schläge, 
[lego], kFra. [fle:f], ab. Diese Abweichung befand sich in Hauptperiode 5 
in Auflösung hin zum Hochdeutschen, z.B. in [Sle:[]* — [Sle:[]? (Rau: 18). 

Belege: » Esel. (esel). > [e:zl]: RAu?, 97.1: öl. — » heben. (heben). > [he:vo]: 
Rau, 97.1: hewa. — » Räder. (reder). > [red&]?/[re:d&]*: vgl. Rad, S. 323. — 
» Schläge. (slege). D [Sle:f]*/[fle:f]’: vgl. schlagen, S. 322. — » Zähne. (zene). > 
[tse:/ts£r]: vgl. Zahn, S. 323. 

(d) Gedehntes E: vor historischem -R — kFra. langes überoffenes E, also 
[zer], z.B. in du fährst mit |farest] (Rau: 97.2). Dieser Lautstand ist dem 
Hochdeutschen ähnlich, wobei die Öffnung im Frankfurterischen tendenziell 
größer ist. 


Belege: » Ärmel. (ermel). > [zereml]: vgl. Arm, S. 323. — » eher. (cher). D 
[ee]: Rau, 97.2: &%. — » fährt. (vert). > [fzeret]: vgl. fahren, S. 322. 


3. Mhd. altkurzes sekundäres Umlaut-Ä 


(a) Kurz gebliebenes Ä (vor allem in geschlossener Tonsilbe oder rückver- 
kürzt) — kFra. kurzes offenes [e], z.B. in Äcker mit [eg&] oder Äpfel mit 
[ebl] (RAu: 98.1). Dieser Lautstand ist dem Hochdeutschen im Wesentlichen 
gleich. Im Frankfurterischen löste nachfolgendes |-[] bzw. [-3-] vereinzelt 
Umlautung aus. Um 1920 war das nur noch bei waschen, [vezo], der Fall, 
doch lauteten Tasche und Flasche im Mittelalter ebenso um. 

Belege: » Äcker. > [eg]: vgl. Acker, S. 299. — » Äpfel. > [ebl]: vgl. Apfel, S. 
299. — » Fäden. > [fedm]: vgl. Faden, S. 344. — » Flasche. vgl. S. 299. — » Tasche. 
vgl. S. 300. — » waschen, Wäsche. > [*e]': WÜM!', 17 (1419): wesschen. WÜM', 17 
(1335 und 1463): geweschen (gewaschen). D [ve35, vef]: MABP°, 14: ze wesche. OPZ?, 
1.43.15: ich wösche. OPZ?, 1.22.1: Wöschsäf. Rau?, 99: weso, wes. 

(b) Kurz gebliebenes Ä vor Nasal — kFra. kurzes geschlossenes [e], z. B. 
in Pflänzchen mit [plenzi:] (R.Au: 98.2). Hier tritt das Frankfurterische in 
Opposition zum Hochdeutschen, das hier [e] hat. 

Belege: ® Kränze. > [krends]: Rau“, 98.2: krends. — » Pflänzi. > [plenzir]: 
vgl. Pflanze, S. 413. 

(c) Kurzes oder gekürztes Ä vor historischem -R — kFra. kurzes überoffe- 
nes E, also [2], z.B. in Gärtner mit [geeredn&]! — [geedn&]? (Rau: 98.3). 
Die Kürzungsmechanismen sind identisch zu denen von A (vgl. Abschnitt 
9.7 auf S.336). Der Lautstand ist dem Hochdeutschen ähnlich, doch im 
Frankfurterischen tendenziell offener. 

Belege: ® Gärtner. > [daeredn&]?/ [Jaeedn&]°: vgl. Garten, S. 342. — » Wärter. 
> [vaered£]?/[verd&]’: Rau‘, 98.3: wärdä, wälrda. 
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(d) Gedehntes Ä: (vor allem in offener Tonsilbe) — kFra. langes offenes [er], 
z.B. in Träger mit [tre:3&] (RAu: 98.1). Dieser Lautstand ist dem Hoch- 
deutschen im Wesentlichen gleich'?!. Das Frankfurterische lautete allerdings 
in der Flektion vor [-[] bzw. [-3-] öfters um und zwar im Gegensatz zum 
Hochdeutschen: z.B. in nhd. er sagt, [sa:gt], kFra. [se:ft]. 

Belege: ® Gräber. > [kre:v&]: vgl. Grab, S. 323. — » sagt. > [Se:ft]: vgl. sagen, 
S. 322. — » Träger. D [tre:3&]: vgl. tragen, S. 322. 

(e) Gedehntes Ä: vor Nasal — kFra. langes offenes [e:], z.B. in nämlich mit 
[nermlif] Der Lautstand ist dem Hochdeutschen ähnlich, doch im Frankfur- 
terischen tendenziell offener. 

Belege: » ähnlich. (ähnlich). > [emlif]: Rau“, 98.2: Enlis. — » nämlich. (näm- 
lich). & [nermli[]?: OPZ?, 1.23.13: namlich. > [nermlif]*: RaAu?, 98.2: nemlis. 


4. Mhd. altkurzes I 


(a) Kurz gebliebenes ı (vor allem in geschlossener Tonsilbe) — kFra. kurz- 
es geschlossenes [il], z.B. in Fisch mit [fif] (Rau: 101). Die Zentralhessisch 
sprechenden Vororte hatten hier zu E gesenktes I, also [e]. Das Frankfur- 
terische ist hier unterschiedlich zum Hochdeutschen, was an dieser Stelle 
kurzes offenes [1] hat. 


Möglicherweise war aber der ursprüngliche Lautwert von altkurzem I 
im Frankfurterischen eher ein E-Laut. Indizien dafür sind die Reliktwörter 
nhd. schwimmen, mhd. swimmen, kFra. [[vemo], und nhd. bringen, mhd. 
bringen, kFra. [preno], die Wülcker in Hauptperiode 3 noch als gebräuch- 
lich notierte (WÜF: 13). In Rauhs Hauptperiode 4 war die E-Aussprache 
in diesen beiden Wörtern schon fast ausgestorben und nur noch der älte- 
ren Generation geläufig: An ihre Stelle trat der sonst im Frankfurterischen 
übliche I-Laut, also kFra. [[vimo] und kFra. [prigo] (RAu: 101.4). 

Belege: » bringen. (bringen). > [preya]?*: OPZ?, 1.30.3: brengt. WÜF?, 13: pren- 
ge. RAu?, 101.4: preyo. > [prigo]*: RAu*, 101.4: prino. — » Fisch. (visch). > [fif]: 
Rau, 101.1: fi$. — » Hitze. (hitze). > [hits]: Rau“, 101.1: hit$. — » schwimmen. 
(swimmen). D [[vema]?: WÜF®?, 13: schweme. R.Au?, 101.4: $wema. > [fvima]*: Rau“, 
101.4: $wima. — » singen. (singen). > [sigo]: RAu*, 101.1: sipo. 

(b) Kurz gebliebenes I vor historischem -R und Konsonant — kFra. 
kurzes überoffenes E, also [ae], z.B. in Kirche mit [k"aef] (Rau: 100.2). 
Diese dialekttypische Öffnung vor R kommt im Hochdeutschen nicht vor. 

Belege: ® Birnen. (birn). D [been]: vgl. Birne, S. 417. — » Hirsch. (hirsch). > 
[haeef]: Rau“, 101.2: has. — » Kirche. (kirche). > [kPzzef]: Rau“, 101.2: kha*S. 
— >» wird. (wirdet). > [vet]: Rau“, 101.2: wat. — » wirft. (wirft). > [veeft): 
Raut, 101.2: weft. — » Wirt. (wirt). > [vet]: Raut, 101.2: watt. 

(c) Gedehntes 1: (vor allem in offener Tonsilbe) — kFra. langes geschlossenes 
[ir], z.B. in dir mit [dire] (Rau: 101.1). Dieser Lautstand ist identisch mit 
dem Hochdeutschen. 


151 Allerdings nicht dem Kiel-Korpus, das an dieser Stelle tendenziell geschlossenes langes [e:] 
hat. 
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Belege: ® Birne. (bir). > [bire]: RAut, 101.1: bi* (Sing.). © Umlaut: Birnen, Pl.: 
» [been]: Rau“, 101.2: ben. — » dir. (dir). > [dire]: Rau?, 101.1: dit. — » hin. 
(hin). > [hi:]: OPZ?, 1.46.4: dähr. Rau, 101.1: hr. — » Stiel. (stil). > [fdirl]: Rau“, 
101.1: Sdil. — » wir. (wir). > [mire]: Rau“, 101.1: mit. 


5. Mhd. altkurzes germanisches E 


(a) Kurz gebliebenes E (vor allem in geschlossener Tonsilbe) — kFra. offenes 
[e], z.B. in Pfeffer mit [pev&] (RAu: 100.1). Dieser Lautstand ist dem 
Hochdeutschen ähnlich, wobei die Öffnung im Frankfurterischen tendenziell 
größer ist. 

Belege: ® Dreck. (dree). > [trek]: Rau, 100.1: trek. RAu?, 70: treksak. RauZ?, 
MW: dr&gkasda, dr&ksäk. — » essen. (&zzen). D [ezo]: Rau“, 100.1: eso. — » Leder. 
(leder). > [led]: Raut, 100.1: ledä. — » Nebel. (nebel). > [nevl]: Rau?, 100.1: 
newl. — » Pfeffer. (pföffer). » [prev&]: OPF?, 1.5.70: pefferkörn (Pfefferkorn). Rauf, 
100.1: phevä. 

(b) Kurz gebliebenes & vor historischem -R — kFra. kurzes überoffenes E, 
also [2], z.B. in Herz mit [heets] (RAu: 100.2). Dieser Lautstand ist dem 
Hochdeutschen ähnlich, wobei die Öffnung tendenziell größer ist. 

Belege: » Herz. (herz). > [haets]: OPZ?, 1.23.3: Herz. Rau*, 100.2: hatts. 
— » Kern. (körne). > [kPzen]: Rau, 100.2: kha*n. — » werden. (werden). > 
[veen/vzeren]: Rau‘, 100.2: wen, w&®)n. — » werfen. (werfen). D [vaevo]: 
Rau, 100.2: wae®vo. 

(c) Kurz gebliebenes E vor -ST — kFra. kurzes geschlossenes [e], z.B. in 
Schwester mit [[vesd&] (RAu: 100.4). 

Belege: » Nest. (nöst). > [nest]: Rau“, 100.4: nest. — » Schwester. (swöster). 
D [Svesd&]: Rau“, 100.4: Swesdä. 

(d) Kurz gebliebenes E vor Nasal — kFra. kurzes geschlossenes [e], z.B. 
in Sense mit |sends] (R.Au: 100.3) Dieser Lautstand ist unterschiedlich zum 
Hochdeutschen, das hier [e] hat. 

Belege: » Bremse. (bröme). > [prems]: OPZ?, 1.40.15: Prömm. Rau?, 100.3: 
prems. — » Senf. (senf). > [semf]: RAu?, 207: semf(t). — » Sense. (sögense). D 
[sends]: Rau, 100.3: send. 

(e) Gedehntes Er: (vor allem in offener Tonsilbe) — kFra. langes offenes [er], 
2.B. in Regen mit [re:39]* — [re:39]° (Rau: 100.1). Entsprechende Formen 
notierte Oppel, so etwa (Stäch) oder (Rächebooche) für Steg bzw. Regenbo- 
gen. Dieser Lautstand ist fundamental unterschiedlich zum Hochdeutschen, 
das hier [er] hat und an das sich das Neu-Frankfurterische annäherte. In die- 
se Klasse fallen auch archaische Formen wie [ge:l] für gelb. Allerdings war 
der Zustand in Hauptperiode 5 schon in Auflösung und eine Ausgleichs- 
bewegung von 2.B. für Weg [ve:f] — [verf]? setzte sich durch, wobei aber 
schlecht, |fle:ft], scheel, [fe:l], und gelb, [ge:l], Ausnahmen waren, die auf 
dem alten Lautstand verblieben (RAu: 18). Der Laut in den Vororten war 
ähnlich, doch noch deutlich offener: Rauh hörte z.B. [r&:30] für Regen in 
Sachsenhausen. 
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Die Beleglage ist in den vorliegenden Tonaufnahmen zu dünn, als dass 
dieser interessante Fall mit dem VOKALJÄGER vermessen werden könnte. 
Dies wäre eine prototypische Nutzung des sonst in dieser Arbeit nicht ver- 
wendeten gleitenden Merkmals der Offnungsstufe der Vorderzungenvokale. 

Belege: » gelb. (gel). > [geil]: OPZ?, 1.23.16: gele. RAu?, 100.1: gel. — » lesen. 
(lesen). > [lerzo]: Rau“, 100.1: l&so. — » Regen. (rögen). > [re:30]?: OPF?, 
1.515: Rächebooche. OPZ?, 1.26.13: es rächent (es regnet). Rau®, 100.1: r&so. RAu%, 
213.12: r&Sona (regnen). > [re:30]°: RaAu*, 100.1, Anm. 2: er © Sachenhausen: D 
[rze:30]: RAu*, 100.1, Anm. 2: R&28o. — » scheel. (schel). > [fe:l]: Rau*, 100.1: el. 
— » schlecht. (sleht). > [fle:ft]: Raut, 100.1: slefs]t. RauZ°: slet, „heute noch die 
Form für schlecht “. — » Steg. (stöc). & [Sterf]*: OPF?, 1.338: Stäch. RAu?, 100.1: 
tes. D [fterf]’>: Raut, 100.1, Anm. 2: er. — » stehlen. (stelen). > [Sde:lo]: Rauf, 
100.1: Sd&lo. — » Weg. (wec). > [ve:f]*: OPZ?, 1.17.6: Holzwääch (Holzweg). Rau*, 
18: w&s. D [verf]?: RaAu?, 18: wes. 

(f) Gedehntes E: vor historischem -R — kFra. langes oder rückverkürztes 
überoffenes E, also [ae:/a], z. B. in sterben mit [Sdaerevo] (RAu: 100.2). Die- 
ser Lautstand ist dem Hochdeutschen Ähnlich, wobei die Öffnung tendenziell 
größer ist. 

Belege: » Bär. (ber). > [bare]: OPZ?, 1.23.5: Bärn (Akk.). RAu*, 100.2: b&*. 
— » Berg. (bere). > [bzref]*: Rau?, 100.2: ba*s. RauZzt, GK: bats. > [baef]°: 
Rau*, 211.a: bae®s, „unter schriftsprachlichem Einfluß die Verkürzung“. — » der. (der). 
D [daere]: Raut, 100.2: d&®. — » sterben. (sterben). > [Sdrevo]: Rau“, 100.2: 
Sa" wo. 


(g) Gedehntes E: vor Nasal — kFra. langes geschlossenes [er], z. B. in Strähne 
mit [ftrern] (Rau: 100.3) 


Belege: ® Lehne. (len). > [len]: Rau, 100.3: len. — » Sehne. (sen). > [sern]: 
Rau?, 100.3: sen. — » Strähne. (strön). > [ftrern]: Rau?, 100.3: Strren. 


6. Mhd. altkurzes Oo 


(a) Kurz gebliebenes o (vor allem in geschlossener Tonsilbe) — kFra. kurzes 
geschlossenes [o]‘, das sich im Neu-Frankfurterischen zu [5] öffnet, z.B. 
in Tropfen mit |trobo] (RAU, 103.1; für eine ausführliche Darstellung vgl. 
Abschnitt 9.2 ab S. 287). Das Frankfurterische lautete somit anders als das 
Hochdeutsche, was an dieser Stelle kurzes offenes [5] hat. 


(b) Kurz gebliebenes oO vor historischem -R und Konsonant — kFra. 
kurzes offenes [>], z.B. in Wort mit [vset] (RAU, 103.3; für eine ausführliche 
Darstellung vgl. Abschnitt 9.2 ab S. 287). Dieser Lautstand ist identisch mit 
dem Hochdeutschen. In Einzelwörtern vor -RT gab es in Hauptperiode 5 eine 
Tendenz hin zu einem palatisierten hellen [a], etwa in fort, [foet]* — [fat]?. 


(c) o vor intervokalischem oder auslautendem -R — kFra. langes geöff- 
netes [o:], z.B. in geboren mit [geboren] (RAU, 103.3; für eine ausführliche 
Darstellung vgl. Abschnitt 9.2 ab S. 287). Der hochdeutsche Lautstand ist 
unterschiedlich mit langem geschlossenen [oz]. 
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(d) Gedehntes o: (vor allem in offener Tonsilbe) — kFra. langes geschlossenes 
[or], z.B. in Bogen mit [boryo] (RAu, 103.1; für eine ausführliche Darstel- 
lung vgl. Abschnitt 9.2 ab S.287). Dieser Lautstand ist identisch mit dem 
Hochdeutschen. 


(e) Gedehntes o: vor historischem -R und Konsonant — kFra. langes 
offenes [31], z.B. in Sorgen mit |[sorejo] (RAU, 103.4; vgl. Abschnitt 9.2, 
S.287f., zu einer ausführlichen Darstellung). Das Hochdeutsche hat an die- 
ser Stelle in der Regel kurzes offenes [>]. 


7. Mhd. altkurzes Umlaut-Ö 


(a) Kurz gebliebenes Ö (vor allem in geschlossener Tonsilbe) — kFra. kurzes 
geschlossenes [e], z.B. in Löcher mit [lez&] (RAu, 105.1; vgl. Abschnitt 
9.10, $.385f., zu einer ausführlichen Darstellung). Das Hochdeutsche hat 
hier kurzes gerundetes offenes [oe]. 


(b) Kurz gebliebenes ö vor historischem -R und Konsonant — kFra. 
kurzes überoffenes E, also [&], z.B. in Dörfer mit [deey&] (RAu, 105.2). 
Das Hochdeutsche hat hier kurzes gerundetes offenes [ce]. 

Belege: ® Dörfer. > [deev&]: vgl. Dorf, S. 290. 


(c) Gedehntes Ö: (vor allem in offener Tonsilbe) — kFra. langes geschlossenes 
[e:], z.B. in Öl mit [eıl] (Rau, 105.1; vgl. Abschnitt 9.10, S.385f., zu einer 
ausführlichen Darstellung). Das Hochdeutsche hat hier langes gerundetes 
geschlossenes [e2]. 


(d) Gedehntes Ö: vor historischem -R und Konsonant — kFra. langes 
überoffenes E, also [ae:], z.B. in Törchen mit [darezo] (RAU, 105.2). Das 
Hochdeutsche hat hier gerundetes geschlossenes langes [et]. 

Belege: ® Törchen. > [da:e39]: vgl. Tor, S. 290. — » Wörter. > [vzered&]: vgl. 
Wort, S. 290. 


8. Mhd. altkurzes U 


(a) Kurz gebliebenes U (vor allem in geschlossener Tonsilbe): — kFra. kurzes 
geschlossenes [u], z.B. in Schnupfen mit [fnubo] (RAU, 106.1). Das Hoch- 
deutsche hat hier kurzes offenes [u]. 

Ähnlich dem altkurzen ı war das altkurze U wohl in Frankfurt einst 
zu O gesenkt. Dafür sprechen die drei einzigen Reliktwörter Puppe, rupfen 
und zupfen. Wülcker hörte sie z.B. noch in Hauptperiode 3 (1875-1900) als 
[bop], [Robo] und [tsoba]. Oppel fielen genau dieselben drei Wörter auf und 
er notierte für (Bobb, robbe, zobbe) „8 < 12 evtl.“, also eine vermutete 
Lautwandelregel (o) — (u) (OPF:1.364). Auch Rauh hörte 1920 noch diese 
drei Reliktwörter. 


Belege: » Butter. (butter). > [bud&]: OPF?, 408: Büddör. RAu?, 106.1: budä. 
— » Fuchs. (vuhs). > [fuks];: Rau?, 106.1: fuks. — » gefunden. (gefunden). D 
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[gofuns]: Raut, 106.1: gefuna. — » Pfund. (pfund). > [pFunt]: RAu*, 106.1: phunt. 
— » Puppe. (puppe). D [bop]: WÜF?, 13: pop. RAu*, 106.3: bop. — » rupfen. (rup- 
fen). > [robo]: WÜF°, 13: rope. RAut, 106.3: robo. — » Schnupfen. (snupfen). > 
[Snubo]: Rau“, 106.1: Snuba. — » zupfen. (zupfen). > [tsobo]: WÜF?, 13: zope. 
Rau“, 106.3: t$oba. 


(b) Kurz gebliebenes U vor historischem -R und Konsonant — kFra. 
kurzes offenes [>], z.B. in Durst mit [daeft] (RAU, 106.4). In Einzelwör- 
tern vor -RT/-RST gab es in Hauptperiode 5 eine Tendenz hin zu einem 
palatisierten hellen [a], z.B. [daft]?. Diese dialekttypische Öffnung vor his- 
torischem -R kommt im Hochdeutschen nicht vor, das hier kurzes offenes 


[u] hat. 
Belege: ® Durst. (durst). > [daeft]: Rau?, 106.4: do®st. RauZ?, MW: dö?st. 
D [daft]: Rau?, 42: dast, „überwiegend bei der jüngeren Generation“. — » kurz. 


(kurz). > [kPoets]*: Rau, 106.4: khotts. > [kats]’: RAu*, 106.4 Anm. 4: khats. 
— » Turm. (turm). > [tPoem]: Rau“, 106.4: tho*m. RAu*, 211.b: phatho®n (Dom- 
turm). — ®» Wurm. (wurm). D [voem]: R.aut, 211.2: wolm. — » Wurst. (wurst). 
D [voeft]*: OPZ?, 1.23.15: Worscht. Rau?, 106.4: wo®st. > [vaft]’: Rau?, 42: wast, 
„überwiegend bei der jüngeren Generation“. 

(c) Gedehntes u: (vor allem in offener Tonsilbe): — kFra. langes geschlossenes 
[u:], z.B. in Spur mit [[bure] (RAu, 106.1). Dieser Lautstand ist gleich dem 
Hochdeutschen. 

Belege: » du. (du). D [dur]: Rau?, 106.1: dü. — » Schnur. (snur). > [fnure]: 
Raut, 106.1: $nü®. — » Spur. (spur). > [fbure]: Raut, 106.1: Sbüt. 

(d) Gedehntes u: vor historischem -R und Konsonant —-.kFra. langes 
offenes [57], z.B. in Gurgel mit [go:il] (RAU, 106.4). Das Hochdeutsche hat 
an dieser Stelle in der Regel kurzes offenes [u]. 

Belege: » Gurgel. (gurgel). > [Q>:ill: RAu*, 106.4: göil, göile. 


9. Mhd. altkurzes Umlaut-Ü 


(a) Kurz gebliebenes Ü (vor allem in geschlossener Tonsilbe) — kFra. kurzes 
geschlossenes [i], z.B. in Brücke mit [prik] (RAu, 108.1; vgl. Abschnitt 
9.10, $.385f., zu einer ausführlichen Darstellung). Das Hochdeutsche hat 
hier kurzes gerundetes offenes [v]. 


(b) Kurz gebliebenes Ü vor historischem -R und Konsonant — kFra. 
kurzes überoffenes E, also [ze], z.B. in Bürste mit [beeft] (RAU, 108.3). 
Diese Öffnung vor historischem -RC ist dialekttypisch und kommt im Hoch- 
deutschen nicht vor, was an dieser Stelle kurzes gerundetes offenes [v] hat. 

Belege: ® Bürste. (bürste). D [beft]: OPZ?, 1.21.8: gebörscht (gebürstet). RAu?, 
108.3: baatst. — » dürfen. (dürfen). > [daeevo]: Rau“, 108.3: da*vo. — » Gürtel. 
(gürtel). > [geeedl]: Rau?, 108.3: ga"dl. — » Schürze. > [Sets]: Rau, 108.3: 
Sarrts. 

(c) Gedehntes Ü: (vor allem in offener Tonsilbe) — kFra. langes geschlossenes 
[ir], z.B. in Hügel mit [hi:zl] (RAu, 108.1; vgl. Abschnitt 9.10, S.385£., zu 
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einer ausführlichen Darstellung). Das Hochdeutsche hat hier langes gerun- 
detes geschlossenes |y:]. 


(d) Gedehntes Ü: vor historischem -R und Konsonant — kFra. langes 
überoffenes E, also [ae:], z.B. in Bürger mit [barej&] (RAU, 108.4). Diese 
Öffnung und Dehnung vor historischem -RC ist dialekttypisch und kommt 
im Hochdeutschen nicht vor, was an dieser Stelle kurzes gerundetes offenes 
[v] hat. 

Belege: ® Bürger. (bürgere). > [berej&]: Rau“, 108.3: b&®) jä. — » würgen. 
(würgen). > [vzereje]: RAu*, 108.3: wa) jä. 


9.12.3 Die altlangen Vokale 
1. Mhd. altlanges Ä 


(a) Lang gebliebenes A — kFra. langes dunkles A bzw. [5:]? — [a:]*, das 
im Neu-Frankfurterischen zu [a:]® vollständig entdunkelt, z.B. in Naht mit 
Ina:t]? — [nart]* — [na:t]® (Rau, 109.1; für eine ausführliche Darstellung 
vgl. Abschnitt 9.4 ab S.306). Dieser Lautstand steht in Opposition zum 
Hochdeutschen, das hier langes neutrales [a:] hat. Die Vororte hatten langes 
geschlossenes [o:], was dem Zentralhessischen entspricht. 


(b) Gekürztes A — kFra. kurzes dunkles A bzw. [3]? — [a]*, das schon in 
Hauptperiode 5 zu [a]? entdunkelt, z.B. in gedacht, [godaxt] (RAU, 109.1; 
für eine ausführliche Darstellung vgl. Abschnitt 9.4 ab S.306). Der ur- 
sprüngliche Lautstand steht in Opposition zum Hochdeutschen, das hier 
kurzes neutrales [a] hat. 


(c) Lang gebliebenes Ä vor historisch auslautendem -N — kFra. langes 
dunkles [ä:] mit Tendenz zur Nasalierung, aber nicht durchgehend; z.B. 
in getan mit [Qodä:] (RAU, 109.1; für eine ausführliche Darstellung vgl. 
Abschnitt 9.5 ab $.319). Dieser Lautstand steht in Opposition zum Hoch- 
deutschen, das hier [a:] hat. 


2. Umlaut des altlangen A (mhd. #) 


(a) Lang gebliebenes #: — kFra. langes geschlossenes [er], z.B. in Käse mit 
[k"e:s] (RAu, 113.1). Das Hochdeutsche hat hier langes offenes [er]. Diese 
Abweichung löste sich in Hauptperiode 5 auf, z.B. in nhd. nähen, [ne:on], 
und nkFra. [ne:jo]? — [ne:jo]?. 

Belege: » blähen. (blejen). > [ple:jo]: RAu*, 113.1: pleio. — » bläuen. (blewen). 
D [ple:jo]: vgl. blau, S. 312. — » Käse. (kese). > [kPe:s]: OPZ?, 1.22.11: Schmierkees. 
Rau“, 113.1: khas. — » nähen. (nejen). > [ne:jo]*/[ne:jo]°: vgl. Naht, S. 311. — 
»täte. (tete). > [de:t]: OPF’?, 1.106: ich deet. Rau, 113.1: det. 
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(b) Lang gebliebenes # vor historischem -R: — kFra. langes überoffenes 
E, also [zer], z.B. in sie wäre mit [vaere] (RAU, 113.2). Der Lautstand ist 
gleich dem Hochdeutschen. 

Belege: » Schere. (schere). > [fere]: Rau“, 113.2: $£*. — » wäre. (were). > 
[vaere]: OPF?, 1.317: weer. Rau?, 113.2: wit. 

(c) Gekürztes #: — kFra. kurzes geschlossenes [e], z.B. in Rettich mit [redif] 
(RAU, 113.3). Das Hochdeutsche hat hier kurzes offenes [e]. 

Belege: ® Rettich. (retich). > [redif]: Rau“, 113.1: redis. — » jämmerlich. 
(jemerlich). > [jem&lif]: RAu*, 113.1: jemälis. 


3. Mhd. altlanges i 


(a) 1 in Normalposition — kFra. diphthongiertes [aı], z.B. in treiben mit 
[trarvo] (RAu, 115.1). Dieser Lautstand entspricht dem Hochdeutschen. Vor 
Vokal wurde die zweite Silbe mit [j] schwach halbvokalisch, z.B. in Feier, 
faj&]. 

Belege: » Beil. (bihel). > [baıl]: RAut, 115.1: bail. — » Feier. (feier). > [faj&): 
Rau, 115.2: faiä. — » Keil. (kil). > [kaıl]: Rau“, 115.1: kail. — » treiben. (triben). 
D [traıvo]: OPF?, 1.322: treiw£. Rau*, 115.1: traiwo. — » Weiher. (wiher). > [vaj&]: 
Rauf, 115.2: wajd. 

(b) i vor Nasalen — kFra. diphthongiertes verdunkeltes [aı], z.B. in Wein mit 
[vaı] (RAu, 115.3). Die Vororte verdunkeln insbesondere vor Nasal tiefer 
und in Sachsenhausen lautete Wein [vöı]. 

Belege: » scheinen. (schinen). D [Sams]: Rau*, 115.3: Saina. — » Schleim. 
(slim). > [flaım]: Rau*, 115.3: $laim. © Sachsenhausen: > [[lorma]: RaAut, 115.3, 
Anm. 4: $loima. — » Wein. (win). > [vaı]l: Rau?, 151.2: wäi. © Sachsenhausen: D 
[vörl: Rau“, 115.3, Anm. 4: eblwöi (Apfelwein). 

(c) Analogmonophthongiertes I — kFra. monophthongiertes [ar], z.B. in 
Beil mit [ba:l] (RAU, 115.5; vgl. Abschnitt 9.8.1.6, S.360f., zu einer aus- 
führlichen Darstellung). 


4. Mhd. altlanges & 


(a) Ein Normalposition — kFra. langes geschlossenes [et], z. B. in Schnee mit 
[Jne:] (RAu, 125.1). Der Lautstand ist identisch mit dem Hochdeutschen. 
Die Vororte hatten an dieser Stelle manchmal noch langes geschlossenes [ir], 
was dem Zentralhessischen entspricht. 

Belege: » Klee. (kle). > [kler]: Rau“, 125.1: kl — » Reh. (rech). > [re:]: 
Rau“, 125.1: r&. © Sachenhausen: > [ri]: OPZ?, 11.24.15: Rih, „noch 1875 in den 
Oberhäusern “. — » Schnee. (sne). > [fne:]: OPF?, 1.515: Schnee. Rau*, 125.1: $nö. 


(b) E vor historischem -R — kFra. langes oder gekürztes überoffenes E, also 
[ae:/ze], z.B. in Lehrer mit [laeır&] (RAU, 125.2). Das Hochdeutsche hat 
hier langes geschlossenes [e:] bzw. [e] in der Kürze - die Öffnung vor -R ist 
dialekttypisch. 
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Belege: » erst. (erste). > [awft]: Rau“, 125.2: a®st. — » kehren. (keren). > 
[kPzeren]: Rau, 125.2: umkh&*n. — » Lehrer. (lerer). > [leır&]: Rau, 125.2: 
laerä. — » plärren. (bleren). > [plera]: Rau, 125.2: plaero. 


5. Mhd. altlanges 6 — kFra. langes geschlossenes [or], z. B. in Brot mit [pro:t] 
(RAU, 129; vgl. Abschnitt 9.2, S. 287 £., zu einer ausführlichen Darstellung). Der 
Lautstand ist gleich dem Hochdeutschen; die Vororte hatten hier manchmal 
noch langes geschlossenes [u:], was dem Zentralhessischen entspricht. 


6. Umlaut des altlangen ö (mhd. &) 


(a) & in Normalposition — kFra. langes oder gekürztes geschlossenes [e:/e], 
z.B. in blöd mit [ple:t] (RAu, 130.1; vgl. Abschnitt 9.10, S.385£., zu einer 
ausführlichen Darstellung). Das Hochdeutsche hat hier gerundetes [o:/ce]. 


(b) & vor historischem -R — kFra. langes überoffenes E, also [zer], z.B. in 
hören mit [haeren] (RAU, 130.2). Das Hochdeutsche hat hier gerundetes [e:] 
— die Öffnung vor -R ist dialekttypisch. 
Belege: » hören. (heren). > [haeren]: OPZ?, 1.20.4: heert. Rau?, 130.2: h&*n. 
— » Röhre. (rere). > [rzere]: Rau, 130.2: R&*. — >» stören. (rere). > [Sdzren]: 
Rau, 130.2: sd&"n. 


7. Mhd. altlanges Ü 


(a) Ü in Normalposition — kFra. diphthongiertes [au], z.B. in Haus mit 
[havs] (RAu, 119). Dieser Lautstand ist identisch mit dem Hochdeutschen. 
Belege: ® Haus. (hüs). > [haus]: OPF?, 0.247: nach Hause. RAU, 119: haus. & 
Umlaut: Häuser: » [hoız&]: Rau, 121.1: hoisä. &© Umlaut: Häusi, Dim.: » [hoızir]®: 
Rau?, 216.19: hoisi.  [ho1zjo]’: RAu?, 216.19: hoisjo, „unter dem Einfluß der Schrift- 
sprache“. — » laut. (lüt). > [laut]: Rau“, 119: laut. — » Maul. (mül). > [mau]: 
OPF’?, 1.350: Maul. Rau“, 119: maul. — » Raum. (rüm). > [raum]: RAu*, 119: raum. 
— >» saufen. (süfen). > [sauvo]: Rau“, 119: Sauva. 
(b) Analogmonophthongiertes Ü — kFra. monophthongiertes [a:], z.B. in 
räumen mit [raımo] (RAU, 119 Anm. 1; vgl. Abschnitt 9.8.1.6, S. 360 f., zu 
einer ausführlichen Darstellung). 


8. Umlaut des altlangen © (mhd. ıU bzw. Ü) — kFra. wohl einstmals [*ar]?, 
das sich dann letztendlich zu [or]* wandelte, z.B. in Häuser mit [horz&]*, dem 
hochdeutsches [sv] gegenübersteht. Ebenso hierher gehören IU, die auf alte um- 
gelautete Ü zurückgehen, wie z.B. heute, kFra. [hort], vgl. auch Wiesinger (1980, 
121). Der wohl ursprüngliche Lautstand [*ar]® lässt sich aus Schreibungen bei 
Carl Malß erschließen, der in seinem Bürgercapitain von 1821 noch Formen 
wie (Freind) für Freund oder (deitsch) für deutsch schreibt — Formen, die sich 
bei Friedrich Stoltze nicht mehr finden. Ein weiterer Beleg ist das Reliktwort 
Teufel, was auch noch zu Rauhs Zeiten [darvl]? gesprochen wurde. Ebenso no- 
tierte Oppel ein (Deiwel) (RAu:18, 121 und 133). Zu Oppels Zeiten war der 
Wandel wohl weitgehend abgeschlossen - ein Indiz für eine ursprünglich gegen 
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A geöffnete erste Komponente ist Oppels Notation des Diphthongs mit (oi), 
also der Vokalnummer 11 bzw. [51]. Formen mit [ar] kamen Ende der 1980er- 
Jahre in heute und Feuer nur noch im Süden von Hessen vor. Frankfurt hatte 
erwartungsgemäß [oı] (Friebertshäuser/Dingeldein 1988, Karten 6 und 19). 

Belege: » feucht. (viuchte). D [foıft]: Rau*, 121.1: foist. — » Feuer. (viur). > [foj&]: 
Rau?, 121.2: fojä. — » Häuser. > [ho1z&]: vgl. Haus, S. 423. — » heute. (hiute). > [hoit]: 
Rau“, 123.1: hoit. — » Leute. (liute). > Jloıt]: OPF?, 1.305: Loit. Rau*, 133.1: loit. — 
» teuer. (tiure). > [doj&]: Rau, 133.2: doiä. — » Teufel. (tiuvel). > [dasvl]: OP?, 
1.399: Deiwel. Rau?, 133.2, Anm.: daiwl. 


9.12.4 Die alten Diphthonge 
1. Mhd. Diphthong EI 


(a) EIin Normalposition — kFra. monophthongiert zu langem neutralen [az], 
z.B. in Heide mit [hart]‘. Vermutlich war das Monophthongierungs-A zu 
Oppels Zeiten palataler, also [a:]? (RAU, 122.1; für eine ausführliche Dar- 
stellung vgl. Abschnitt 9.8 ab S. 351). Das Hochdeutsche hat hier [ar]. 


(b) EI vor Nasal — kFra. monophthongiert zu langem [ä:] mit deutlicher Na- 
salierung, z.B. in Stein mit |[da:] (RAU, 122.1; für eine ausführliche Dar- 
stellung vgl. Abschnitt 9.8 ab S. 351). Das Hochdeutsche hat hier [ar]. 


2. Analogumlaut des mhd. Diphthongs Eı — kFra. langes offenes [er], z.B. 
in du heißt mit [heist] (RAU, 124; vgl. Abschnitt 9.8.1.6, S. 360 f., zu einer aus- 
führlichen Darstellung). Dies ist eine Umlautung des aus EI monophthongierten 
[a:], die analog zum normalen sekundären Umlaut von [a:] gebildet wurde (Wie- 
singer 1980, 95). Das Hochdeutsche hat hier keine Umlautung und behält [ar]. 


3. Mhd. Diphthong IE 


(a) [Ein Normalposition — kFra. langes geschlossenes [ir], z. B. in fliegen mit 
[flir}o] (RAU, 132). Der Lautstand ist identisch mit dem Hochdeutschen. Das 
Zentralhessische hat an dieser Stelle [e1]. 

Belege: » biegen. (biegen). & [bir]: Rau“, 132.1: biso. — » fliegen. (fliegen). 
D [flirjo]: OPZ?, 1.11.14: fire. RAu?, 190.2.b: flo. > [flir3o]®: Rau“, 190.2, Anm. 3: 
fliso, „Halbmundart “. — » tief. (tief). > [di:f]: Rau?, 132.1: dif. — » wie. (wie). D 
[vi]: Rau%, 132.1: wı. 

(b) IE vor historischem -R und Konsonant — kFra. kurzes überoffenes E, 
also [ae], z.B. in der Vierte mit [feet] (RAU, 132.2). Das Hochdeutsche hat 
hier langes geschlossenes [ir], der Dialekt übliche Offnung vor historischem 
-RC, hier mit Kürzung. 

Belege: » vierte. (vierte). > [feet]: Rau“, 132.2: fa*t. 
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4. Mhd. Diphthong ou — kFra. monophthongiert zum langen neutralen [ar], 
z.B. in Auge mit [a:x] (RAU, 126.1; vgl. Abschnitt 9.8, S.351£., zu einer aus- 
führlichen Darstellung). Vermutlich war das Monophthongierungs-A zu Oppels 
Zeiten palataler, also [a:]? Das Hochdeutsche hat hier den Diphthong [av]. 


5. Umlaut des Diphthongs OU 


(a) Alter Diphthong-Umlaut ÖU — kFra. monophthongiert zu langem neu- 
tralen [a:]?, das sich aber in Hauptperiode 4 zu [or]? aufgelöst hatte, z.B. in 
Freude mit [fraxt]? — [frort]? (RAU, 126.1; für eine ausführliche Darstellung 
vgl. Abschnitt 9.8 ab S.351). Vermutlich war das Monophthongierungs- A 
zu Oppels Zeiten palataler, also [a:]? Das Hochdeutsche hat hier [>v]. 

(b) Jüngerer Analogumlaut — kFra. langes offenes [er], z. B. in Bäume mit 
[berm] (RAU, 128.1). Diese Form ist eine Umlautung des aus OU mono- 
phthongierten [a:]-Lauts, die analog zum normalen sekundären Umlaut von 
[a:] gebildet wird (Wiesinger 1980, 95). Das Hochdeutsche hat hier [sv]. 

Belege: » Bäume. (böume). > [beim]: vgl. Baum, S. 362. — » haut. > [heift]: 
vgl. hauen, S. 363. — » käufst. > [kPe:fst]: vgl. kaufen, S. 363. — » läuft. > [leıft]: 
vgl. laufen, S. 363. 


6. Mhd. Diphthong UO 


(a) UO in Normalposition — kFra. monophthongiert zu langem geschlosse- 
nen [ur], z.B. in Bruder mit [pru:d&] (RAU, 117). Der Lautstand ist iden- 
tisch mit dem Hochdeutschen. 

Belege: ® Bruder. (bruoder). > [pru:rd&]: Rau“, 117: prüdä. — » Fuß. (fuos). 
D [furs]: — » gut. (guot). D [Qu:t]: Rau, 117: güt. 

(b) vo (verkürzt) — kFra. monophthongiert und dialektal verkürzt zu kurzem 

geschlossenen [u], z.B. in Tuch mit [dux] (RAu, 117). 


Belege: » Blume. (bluome). > [plum]: Rau*, 117: plum. — » Buch. (buoch). > 
[bux]: Rau, 117: bux. — » Kuchen. (kuochen). > [kPuyo]: Rau, 195: khuxa. 


7. Umlaut des Diphthongs Vo (mhd. ÜE) 


(a) ÜE in Normalposition — kFra. monophthongiert und entrundet zu lan- 
gem geschlossenen [ir], z.B. in Blüten mit [plirdo] (RAUuH, 118; vgl. Ab- 
schnitt 9.10, $.385f., zu einer ausführlichen Darstellung). Das Hochdeut- 
sche hat hier gerundetes langes geschlossenes [y:] 


(b) ÜE (verkürzt) — kFra. monophthongiert, entrundet und gekürzt zu kurz- 
em geschlossenen [il], z.B. in brüllen mit [prilo] (RAUH, 118; vgl. Abschnitt 
9.10, S.385f., zu einer ausführlichen Darstellung). 
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Kapitel 10 


Schlussbetrachtung und Ausblick 
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10.1 Schluss 


Diese Arbeit spannt den Bogen von algorithmischer Messphonetik über Klassifi- 
kationsphonetik mittels Machine-Learning bis hin zur Dialektphonologie. Mit dem 
VOKALJÄGER wurde ein leistungsfähiges, statistisches Werkzeug konzipiert und 
geschaffen, das zeigt, wie produktiv solch ein transdisziplinärer Ansatz sein kann. 


Im Bereich der Messphonetik wurden für den VOKALJÄGER Algorithmen entwi- 
ckelt, die - im Augenblick noch mit Einschränkung hinsichtlich der Segmentierung 
— eine fast vollständig automatisierte Berechnung akustischer Größen aus Ton- 
aufnahmen ermöglicht, ohne, dass dabei menschlich-subjektive Intervention nötig 
wäre. Dazu gehört insbesondere die Korpus-unabhängige Berechnung und Spre- 
cher-Normalisierung von Formantbahnen, die robust gegenüber Messfehlern, Aus- 
reißern und speziell Unterschieden in den Lauthäufigkeiten ist. Im Ergebnis lassen 
sich so z.B. im Kiel-Korpus Formanten messen, die den üblichen, erwarteten Wer- 
ten und Mustern für das Hochdeutsche entsprechen (vgl. Teil I der Arbeit und 
vornehmlich Abbildung 56 auf S. 151). 

Zur Identifikation und Messung von Lautunterschieden auf einer kontinuierli- 
chen, gegen das Hochdeutsche geeichten Skala, wurde das Konzept des gleitenden 
phonetischen Merkmals eingeführt. Der daraus abgeleitete Merkmalswert ( ‚gleitet‘ 
zwischen den klassisch-ordinalen Elementarausprägungen wie z.B. ‚offen‘, ‚halbof- 
fen‘, ‚halbgeschlossen‘ und ‚geschlossen‘ und kann dabei Zwischenwerte annehmen, 
die sonst üblicherweise mit Diakritika bezeichnet werden. Es kann nun getestet 
werden, ob sich die Merkmalswerte zwischen zwei Kontrastgruppen statistisch si- 
gnifikant unterscheiden, wie etwa zwischen den kurzen A und den Dehnungs-A. Mit 
der so errechneten Merkmalsdifferenz Al kann z. B. bestimmt werden, ob bzw. wie 
stark in einem solchen Kontrastpaar ein Merger hinsichtlich des gleitenden Merk- 
mals der Öffnungsstufe der Hinterzungenvokale vorliegt. 

Mathematisch-technisch ist der beschriebene Ansatz im VOKALJÄGER mit- 
tels Machine-Learning-Algorithmik implementiert. Dabei wird der VOKALJÄGER 
auf die Merkmale des Hochdeutschen, repräsentiert durch zehntausend Vokalpro- 
ben aus dem Kiel-Korpus, trainiert. Es zeigt sich, dass mit dem mathematischen 
Schätzermodell der Mixture-Discriminant-Analysis und den ersten drei Formanten 
als messphonetische Prädiktorvariablen gleitende Merkmalswerte errechnet werden 
können, die den erwarteten Mustern des Hochdeutschen entsprechen (vgl. Teil II 
der Arbeit und insbesondere Abbildung 85 auf S. 228). 


Es ist ein besonderer Glücksfall, dass für den Frankfurter Stadtdialekt zwei unab- 
hängige Bestandsaufnahmen existieren, die etwa siebzig Jahre auseinanderliegen. 
Da ist zum einen Joseph Oppel, der von 1839 bis 1894 handschriftlich Aufzeich- 
nungen zur Mundart anfertigte, die vor allem hinsichtlich der Vokalqualität und 
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-quantität explizit und hoch präzise sind (Oppel 1839-1894). Zum anderen ist da 
Ludwig Rauh, der 1921 mit seiner handschriftlichen Dissertation zum Frankfurte- 
rischen promovierte und bis zu seinem Tod 1945 die Grundlagen für das erst 1988 
fertiggestellte Frankfurter Wörterbuch schuf (Rauh [1921a] und Rauh/Bodensohn 
[1939-1945]). Oppels und Rauhs Schriftbelege aus dem Frankfurter Institut für 
Stadtgeschichte, die so nicht im Frankfurter Wörterbuch veröffentlicht wurden, 
sind hier zum ersten Mal mit phonetisch-phonologischer Präzision kontrastiv ge- 
genübergestellt und ausgewertet worden. 


Durch die einzigartigen Belege Oppels und Rauhs lässt sich der Lautwandel des 
Frankfurterischen von etwa 1825 bis 1945 in Real-Time darstellen. Mit dem Vo- 
KALJÄGER ist es darüber hinaus möglich, die Schriftbelege durch klassifikations- 
phonetische Untersuchungen zu ergänzen, die ebenfalls Real-Time-Einblicke geben. 
Zum Frankfurterischen existiert mit dem Frankfurter Lautdenkmal von 1937 ei- 
ne Tonaufnahme aus der Spätphase des Stadtdialekts — diese kann kontrastiv um 
weitere Tondokumente aus neuerer Zeit ergänzt werden, insbesondere aus dem 
Projekt Regionalsprache.de (REDE). 

Es zeigt sich ein moderater Wandel des Frankfurterischen von etwa 1825 bis 
1945 und dann eine rapide Wandlung bis heute. Definiert man Frankfurterisch 
als die rheinfränkische Mundart, die unterschiedlich zur Umgebung ist und nur in 
Frankfurt gesprochen wird, starb dieser Stadtdialekt als eine distinktive Einheit 
nach 1945 aus. Für das Frankfurterische wesentlich sind gerade Merger-Prozesse. 
So fielen etwa das altlange Ä und das Dehnungs-A in einem dunklen [5r]-ähnlichen 
Laut zusammen, der in dieser Arbeit als dunkles A, [az], bezeichnet wird - an- 
ders als z.B. im Zentralhessischen der Vororte, wo A ein geschlossenes [o:] war. 
Dieses dunkle A, das ‚Wahrzeichen‘ des Stadtdialekts, das sowohl lang als auch 
kurz vorkam, verschwand im Lauf der Zeit. Mit dem VOKALJÄGER kann man 
es im Frankfurter Lautdenkmal von 1937 noch sehr gut messen - im Neu-Frank- 
furterischen ist nur noch der Merger mit dem neutralen [a] festzustellen. Bei den 
Vorderzungenvokalen ist es umgekehrt. Hinsichtlich des gleitenden Merkmals der 
Rundung der Vorderzungenvokale zeichnete sich das Frankfurterische durch einen 
Zusammenfall (hochdeutsch) runder und ungerundeter Vokale in einem entrunde- 
ten Zustand aus. Diese Entrundung ist mit dem VOKALJÄGER noch durchgehend 
im Frankfurter Lautdenkmal, aber auch im Neu-Frankfurterischen messbar - aller- 
dings mit deutlich abnehmender Durchdringung: der Frankfurter Merger-Zustand 
bezüglich Rundung wird aufgelöst (vgl. Teil III und speziell die Abbildungen 116 
auf S.405 und 117 auf S. 407). 


Abschließend lässt sich feststellen, dass mit dem VOKALJÄGER ein neues Werkzeug 
in die historische Dialektphonologie eingebracht werden konnte. Der VOKALJÄ- 
GER sowie die Schriftbelege Oppels und Rauhs ermöglichten zum ersten Mal, eine 
phonetisch-phonologische Lautwandeluntersuchung des Frankfurter Stadtdialekts 
durchzuführen - und zwar in Real-Time über fast zweihundert Jahre. 
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10.2 Ausblick 


Was sind nun die nächsten Schritte? Welche weiteren Projekte zum oder mit dem 
VOKALJÄGER könnten sich an diese Arbeit anschließen? Denkbar sind Schritte, 
die sich grob drei Blöcken zuordnen lassen. Alle liegen im Bereich des Möglichen 
und würden insgesamt nur eine überschaubare Zeit zur Umsetzung in Anspruch 
nehmen: 


10.2.1 Fortentwicklung der Methode des VokalJägers 


Die Algorithmik des VOKALJÄGERSs kann in vielerlei Hinsicht erweitert werden. 
Manche Ergänzungen erscheinen zwingend notwendig, um den VOKALJÄGER als 
ein allgemeines Werkzeug zu platzieren. Allgemein steckt sicher noch einiges an 
Potential im bloßen Optimieren der Algorithmik und Stellwerte. Hinsichtlich der 
Messphonetik wäre die neue Fähigkeit wünschenswert, das Sprachsignal eigenstän- 
dig zu segmentieren. Für lautmalerisch transkribierte Korpora wie die Lautdenk- 
mal-Aufnahmen könnte der Ansatz ein dynamisches Abbilden der Umschrift auf 
das Lautsignal sein. Die Messphonetik des VOKALJÄGERSs könnte hinsichtlich der 
Robustheit erweitert werden. Dazu gehört eine Methode zum Umgehen mit syste- 
matischen Lücken bzw. Verzerrungen des Vokalsystems, wie z.B. im Sächsischen 
mit seiner Tendenz der Zentralisierung der Hinterzungenvokale. 

In der Klassifikationsphonetik stellen sich neue Herausforderungen, insbeson- 
dere, wenn auch Konsonanten berücksichtigt werden sollen. Aber auch im Bereich 
des Vokalismus müssten Erweiterungen geschaffen werden, um z.B. mit Diphthon- 
gen, Quantitätsunterschieden oder explizit mit Nasalierung umgehen zu können. 
Es müssten entsprechende gleitende phonetische Merkmale neu aufgesetzt sowie 
kalibriert und trainiert werden. 


10.2.2 Der VokalJäger als Werkzeug für die Forschung 


Der VOKALJÄGER ist im derzeitigen Entwicklungsstand eine Sammlung von mehr 
als 11.000 Zeilen Programmcode, die faktisch nur vom Autor verwendet werden 
können. Für die Forschung wäre es sicher wünschenswert, diesen Code zu struktu- 
rieren und als Programmpaket frei zugänglich zu machen. 

Auch wäre es möglich, die Funktionalität des VOKALJÄGERS in eine moderne 
App für mobile Endgeräte zu portieren und zu publizieren. Das würde z.B. einem 
Explorator ermöglichen, vor Ort und ad hoc mit einem Smartphone (-Merkmals- 
werte zu messen und Hypothesen über Lautdifferenzen bzw. Merger zu testen. 
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10.2.3 Weitere Anwendungen des VokalJägers 


Zum Frankfurterischen wäre es interessant, noch weitere Frankfurter Tondokumen- 
te zu vermessen und somit weitere phonetische Real-Time-Belege zu sammeln. So 
könnte die These vom Untergang des Frankfurter Stadtdialekts nach dem Zwei- 
ten Weltkrieg weiter getestet werden, insbesondere hinsichtlich des Verlusts des 
dunklen A-Lauts bzw. des Mergers dieses Lauts mit dem neutralen A. 

Doch das eigentliche Ziel müsste sein, mit einem deutlich erweiterten VOKAL- 
JÄGER, groß-komparative Dialektanalysen zu fahren. Hier bietet sich an, das voll 
automatisierte Analysieren aller Lautdenkmal-Aufnahmen anzustreben. Das Er- 
gebnis wäre eine Sammlung statistischer Daten, insbesondere der Merkmalswerte, 
Merkmalsdifferenzen und ihrer Signifikanzen, die eine phonetisch-phonologische 
Untersuchung der Lautdenkmal-Aufnahmen deutlich erleichtern würde. 

Der VOKALJÄGER könnte auch auf das Messen von Spracheigenheiten von L2- 
Sprechern trainiert werden - hier würde er systematische Abweichungen gegenüber 
dem Hochdeutschen erfassen, die ihren Grund in der Mutter- bzw. L1-Sprache 
haben. Man könnte dann den VOKALJÄGER zur autodidaktischen Sprachschulung 
nutzen, indem man die Sprecher auf ihre Abweichungen automatisch hinweist und 
überwachte Übungen anbietet, um die Artikulation interaktiv zu verbessern. 
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Anhänge 
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Anhang A 


Inhaltliche Spezialthemen 


Dieser Anhang sammelt einige Anmerkungen zur Notation und allgemeinen Ver- 
fahren, wie sie in dieser Arbeit zur Anwendung kommen. Der Anhang dient als 
Referenz und wird vom Hauptteil aus verwiesen. 
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A.l Textsatz 


A.1.1 Phonetisch-phonologische Zeichen und Fließtext 


[a]; P]) --- 


(ä), (fraäa), ... 


„was hät er“ 


‚Begriff‘ 


Lemma 


-RT, -HT, ... 


Eckige Klammern: Klassifikationsphonetisches Lautsymbol für 
Laute a, > usw. in IPA-Notation (vgl. Abschnitt 2.2.1, S.20£.). 
Eine Ausnahme ist die phonologisch motivierte Schreibung [a] für 
das dunkle Frankfurter A, das etwa den Lautwert des IPA-[>] hat 
(vgl. Abschnitt 9.4.1.1, S.307£.). 

Geknickte Klammern: Grapheme bzw. exakte Reproduktion der 
Schreibung von Lautzeichen und Einzelwörtern. Wird zu Re- 
produktion von Oppels Wort-Belegen, lautmalerischen Mundart- 
schreibungen oder Teuthonista-Lautschrift im Fließtext verwen- 
det; ebenso in Zitaten, wenn originale Lautschreibung reproduziert 
wird. 

Exakte Reproduktion einer Schreibung eines Satzes oder einer län- 
geren Wortfolge. Wird zu Reproduktion von Oppel-Sätzen oder 
längeren Mundartzitaten im Fließtext verwendet — ebenso verwen- 
det für die übliche Zitation. 

Kritisch-distanzierte Verwendung eines Begriffs im Fließtext oder 
Verwendung in einem für das Wort unüblichen Kontext. Wird auch 
im technischen Zusammenhang für Abkürzungen oder zur Referen- 
zierung von Spaltenköpfen verwendet. 

Kursiv: Ein Fachbegriff, ein sprachliches Lemma oder eine Hervor- 
hebung. Nicht-phonetische Lautzeichen in Zitaten werden ebenso 
hervorgehoben. 

Großbuchstaben: Der Laut an sich — das I, das A, das E, ... 
Kapitälchen: Altkurze Vokale i, a, & usw. des normalisierten Mit- 
telhochdeutschen als Referenzlaute (vgl. Abschnitt 7.5.2, S. 267 £.). 
Kapitälchen mit Dehnungszeichen: Ehemalig altkurze Vokale in 
Dehnung des normalisierten Mittelhochdeutschen als Referenzlau- 
te: Dehnungs-i, Dehnungs-a, Dehnungs-£, ... (vgl. Abschnitt 7.5.2, 
S.2672.): 

Kapitälchen mit Zirkumflex: Altlange Vokale 1, ä, ü usw. des nor- 
malisierten Mittelhochdeutschen als Referenzlaute (vgl. Abschnitt 
7:9.2.8b 5.267]; 

Doppelkapitälchen: Alte Diphthonge ie, uo, üe usw. des normali- 
sierten Mittelhochdeutschen als Referenzlaute (vgl. Abschnitt 7.5.2 
ab S.267). 

Kapitälchenschreibung für Konsonanten des normalisierten Mittel- 
hochdeutschen. 
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A.1.2 Mathematische Notation von Signalen 


In einem Lautschall- oder Lautsignal x bezeichnet 
x[t] 


den Signalwert von x zum Zeitpunkt t. Die Schreibkonvention mit eckigen Klammern 
für ein zeitdiskretes Signal folgt Oppenheim/Schafer (1992, 11). t ist dann entweder der 
exakte Zeitindex (also t ist eine ganze Zahl, x|1] der erste Messwert und z[T] der letzte 
Messwert, wobei das Signal, Signalsegment oder Signalfenster 7’ Messwerte hat). Oder t 
ist die relative Zeit (also t ist eine reele Zahl, x[O] der erste Messwert und x[1] der letzte 
Messwert). Die Konvention ergibt sich aus dem Zusammenhang. Das Lautschallsignal (ge- 
nauer: das Mono-Lautschallsignal) hat nur eine Signalkomponente, die digitale zeitliche 
Repräsentation des Lautdruckschalls. Allgemeine Lautsignale, also Werte oder Parame- 
ter, die aus einem Lautschallsignal errechnet wurden, sind in der Regel mehrdimensional 
und haben entsprechend mehrere Signalkomponenten x; (so z.B. die Formanten F'; vgl. 
Abschnitt 3.2). Für die i-te Komponente eines Lautsignals x zu einem Zeitpunkt t steht 


ll]: 
Das hier Gesagte gilt auch allgemein für jede Serie von Messpunkten 
zilk], 


bei der ein Sortieren nach der Zeit t nachrangig ist. Hier wird dann ein Index k ver- 
wendet (z.B. Nummer k des Lautsegments bzw. Vokalprobe in einem Lautsignal, aus 
der ein endgültiger Formant ermittelt wurde, der dann die Indexnummer k erhält). Die 
Schreibweise mit dem Index t wird bevorzugt, wenn die Zeit eine wichtige Rolle spielt 
(z.B. eine Folge von Formanteinzelwerten t innerhalb eines Lautsegments, aus denen eine 
geglättete Formantbahn errechnet wird). Für eine Funktion auf einem Signal wird eine 
Kurzschreibweise genutzt. 


Aa} = falle], 23]... =[B]) 


mit geschweiften Klammern bezeichnet eine Funktion f(.), die auf einer ganzen Reihe von 
T Einzelwerten x|[1], x[2],... [7] des Lautsignals x definiert ist (z.B. der Mittelwert). Im 
Unterschied dazu zeigt die Schreibweise 


fe) = Fa) FEB) FB). Fee) 


mit runden Klammern eine Reihe von Funktionswerten an. Optional gehen in die Funk- 
tion f(.) noch Parameter a, ß, usw. ein. Diese werden nach einem Semikolon gesetzt, 
also 


FIR. B=:n)% 
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A.2 Allgemeine Methoden 


Bei der Auswertung und Darstellung der Ergebnisse werden allgemein übliche Verfah- 
ren und Standards angesetzt. Dieser Abschnitt ist eine kurze alphabetische Auflistung 
und soll als Referenz dienen. Darüber hinausgehende Spezialverfahren werden im Text 
erläutert. 


A.2.1 Bootstrapping 


Zwar lassen sich die auf Rangordnung basierenden Kenngrößen - z.B. die Perzentilmittel 
aus Abschnitt 3.6.2 ab S.86 - direkt aus den vorliegenden Daten errechnen, doch ist das 
Bestimmen von statischen Güteparametern für diese Größen, insbesondere statistischer 
Fehler und Vertrauensintervalle, nicht einfach. Das liegt daran, dass die statistischen 
Verteilungen, denen die Kenngrößen gehorchen (welche ja ebenso abgeleitete statistische 
Größen sind), unbekannt und komplex sind. Deswegen müssen nicht-parametrische Me- 
thoden angewendet werden, die keine Verteilungsannahmen treffen. Das hier üblicherwei- 
se angewendete mathematische Verfahren ist das des bootstrapping, zu dem umfangreiche 
Algorithmen vorliegen (Efron [1979] und Venables/Ripley [2002, 133£.]). Die Kernidee 
des Bootstrappings ist, die Kenngröße(n) auf Stichproben zu errechnen, die wiederholt 
aus den Daten gezogen werden. Die Stichproben werden dabei mit Zurücklegen gezogen, 
also jeder Messwert, der in die Stichprobe eingeht, kann abermals gezogen werden. Die 
Stichprobe hat dabei die Größe der Grundgesamtheit. Man erhält somit aus den Stichpro- 
ben eine Serie von Schätzungen der Kenngröße, aus denen die Schwankungsbreite bzw. 
Standardfehler und die Vertrauensintervalle der Kenngröße errechnet werden können. 

Die Frage nach der Anzahl der nötigen Stichproben wird kontrovers diskutiert. Bei 
Kuhn/Johnson (2013, 72) werden allgemein 50 bis 200 Wiederholungen angesetzt. Ka- 
bacoff (2010, 309) spricht von „1’000 replications are more than adequate in most ca- 
ses“. Für die Bestimmung des Standardfehlers setzen Efron/Tibshirani (1993) 25 bis 200 
Wiederholungen an und empfehlen 1.000 für das Konfidenzintervall. Für diese Arbeit 
werden für die Bestimmung des statistischen Fehlers der Kenngröße 1.000 Wiederholun- 
gen durchgeführt und 5.000 für Vertrauensintervalle. Ein statistischer Fehler, der mittels 
Bootstrappings errechnet wurde, ist stabil (Efron 1983, 328). 


A.2.2 Boxplot-Statistik 


Das Boxplot-Diagramm bzw. die Boxplot-Statistik fasst die wichtigsten statistischen 
Kenngrößen einer Verteilung von Messwerten grafisch zusammen (vgl. Beispielbild un- 
ten): unteres und oberes Quartil; Median und gegebenenfalls Mittelwert; Ausdehnung 
über die Quartile hinaus und Extremwerte. Die hier verwendeten Boxplots folgen dem 
von Tukey vorgeschlagenen Standard, wie er in R implementiert ist (Kabacoff 2010, 133). 
Dabei umzeichnet der zentrale Kasten, box, den Interquartilbereich (IQR), der vom 25%- 
Perzentil P25 bis zum 75%-Perzentil reicht und somit genau die Hälfte aller Messwerte 
umfasst. Der zentrale horizontale Strich korrespondiert mit dem Median bzw. dem 50%- 
Perzentil P50. Die horizontalen Striche entsprechen also den drei Quartilgrenzen P25, 
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P50 und P75. Die oben und unten anschließenden vertikalen ‚Antennen‘, whisker, rei- 
chen bis zu dem Messwert, der maximal 1,5 x IQR vom oberen oder unteren Ende des 
Kastens - also P25 oder P75 - entfernt ist. Optional werden mit einer Raute der Mit- 
telwert und mit Punkten die Extremwerte, welche außerhalb des P25 minus 1,5 x IQR 
liegen (bzw. P75 plus 1,5 x IQR Bereich), angezeigt. 


F1 (Lobanov normalisiert und rückprojiziert) 
ıvaooae 


..:. &8.&a a 0 ö 


ae 


ı 2 e 
. | 
500- == 


750 - 


1.000 = 


A.2.3 Violin-Diagramme 


Ein Violin-Diagramm veranschaulicht eine Verteilungsdichte grafisch (vgl. Beispielbild 
unten). Über eine Achse wird eine Kontur gezeichnet, die dem Körper einer Violine 
grob ähnelt. Je breiter diese ist, desto mehr Messwerte sind an der betreffenden Stelle 
der Achse vorhanden (Wickham [2009] und Hintze/Nelson [1998]). Die ästhetisch glatte, 
einhüllende Formkontur ergibt sich aus einer Kernelschätzung der zugrundeliegenden 
Verteilungsdichte (Venables/Ripley 2002, 126 f.). Die reale Häufigkeitsverteilung weicht 
von dieser ab, was die hart abgeschnittenen Enden der Violin-Konturen erklärt: Der 
Schnitt erfolgt an der Stelle der jeweils größten und kleinsten Messwerte, obwohl die 
Kerneldichte theoretisch über diese hinausgeht, was hier nicht gezeichnet wurde. 


12,5 


T T T T T T 
K6IMR K6SBE K62 Saecht Saech2 FraLD KO1BE K07MR KG1 FraLC 


A.2.4 Signifikante Stellen und statistischer Fehler 


Bei der Niederschrift eines Messergebnisses, welches einem statistischen Fehler unter- 
liegt, stellt sich die Frage nach der zu notierenden Genauigkeit. Das gilt sowohl für das 
Ergebnis als auch für den Fehler. Der statistische Fehler ist hier als absoluter Standar- 
dardnormalfehler zu verstehen. Er ergibt sich aus der üblichen Standardabweichung, dem 
MAD, der Hälfte des Interquartilbereichs IQR oder dem Bootstrapping (vgl. Abschnitt 
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A.2.1 ab S.438). In dieser Arbeit ist ein Messwert bis zu jener Stelle als signifikant no- 
tiert, die der Größenordnung des statistischen Fehlers entspricht. Der Fehler selbst wird, 
der in der Experimentalphysik üblichen Konvention folgend, mit einer Stelle Genauigkeit 
notiert (Taylor 1997, 15). Damit hängt die Anzahl der von Null verschiedenen Stellen 
eines notierten Messwerts vom Messfehler bzw. der statistischen Unsicherheit ab. Zur 
Veranschaulichung folgen Beispiele, in denen derselbe abgelesene Messwert abhängig von 
variierendem Messfehler unterschiedlich notiert wird: 


Messwert Fehler notiert 
9.123,41 0,678 9.124,4 +0,7 
9.123,41 6,78 9.123 +7 
9.123,41 67,8 9.120 +70 
9.123,41 678 9.100 +700 


Man beachte, dass der Fehler immer nur auf eine Stelle Genauigkeit gerundet ist und der 
Messwert genau auf diese Stelle gerundet notiert wird. 

Bei der Notation von Messwerten, deren Schwankungsbreite bzw. Messfehler mit 
einem Intervall angegeben wird, gilt für die Berechnung der signifikanten Stellen die Hälfte 
der Intervallsbreite als statistische Unsicherheit. Dies trifft insbesondere auf die zentralen 
Größen des Merkmalswert C und der Merkmalsdifferenz AC zu (vgl. Abschnitt 5.2 auf 
S.182). Dort wird als Intervall der Wertebereich zwischen dem 25%- und 75%-Perzentil 
angesetzt. Die statistische Unsicherheit ist damit die Hälfte des Interquartilbereichs. 


A.2.5 Signifikanzniveau und t-Test 


Durchgeführt werden Standard Two Sample t-Tests auf identische Mittelwerte zweier 
Gruppen (Venables/Ripley 2002, 115£.). So kann z.B. getestet werden, ob sich im Mit- 
tel F1 für Männer und Frauen unterscheidet. Falls nicht abweichend markiert, wird die 
Variante nach Welch verwendet, die unterschiedliche Varianzen pro Gruppe zulässt und 
es wird keine Paarung der Werte angesetzt. Im Fall einer signifikanten Abweichung der 
Mittelwerte wird die Nullhypothese der identischen Mittelwerte zugunsten der Alter- 
nativhypothese einer Abweichung mit beliebigen Vorzeichen (two sided) verworfen. Das 
Signifikanzniveau ist nach dem p-Wert in den üblichen Konventionen mit Stern-Symbolen 
codiert und mit den in diesem Text verwendeten Bezeichnungen annotiert: x** : p < 0,001 
(überaus signifikant); ** : p < 0,01 (sehr signifikant); * : p < 0,05 (signifikant) sowie ’. : 
p< 0,1 (kaum signifikant) und ’ns’ p > 0,1 (nicht signifikant). Der p-Wert gibt hier die 
Wahrscheinlichkeit an, dass tatsächlich doch eine Identität der Mittelwerte vorliegt. Frü- 
her war es üblich, einen absoluten Schnittpunkt zwischen signifikant und nicht signifikant 
recht willkürlich bei p = 0,05 anzusetzen (Fisher 1950, 80). Heute geht man eher dazu 
über, das Signifikanzniveau anzuzeigen. Es ist auch üblich, den p-Wert direkt niederzu- 
schreiben. Doch ist zu beachten, dass diese Größe einer nicht unerheblichen Unsicherheit 
unterliegt, die sowohl durch das gewählte Testverfahren als auch die Stichprobengrö- 
ße und Zusammensetzung bedingt ist. Somit erscheint eine weniger granulare Anzeige 
mit Sternen (x) hier vernünftig, obwohl es dazu eine ganze philosophische Debatte gibt 
(Dahiru 2008). 

Das hier dargestellte Vorgehen gilt analog für nicht-parametrische Verfahren. In die- 
sem Fall wird die klassische t-Statistik durch die Auswertung einer numerisch mittels 
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Bootstrappings erzeugter Verteilungen ersetzt und die Signifikanz z.B. der Unterschiede 
zwischen den Medianen der Verteilungen bestimmt. 


A.2.6 Fehlerfortpflanzung 


Oft leitet sich aus mehreren Größen x; eine einzelne weitere Größe y ab (z.B. die Per- 
zentilbreite aus dem unteren und oberen Perzentilmittel). Manchmal ist es möglich, den 
absoluten Fehler o der abgeleiteten Größe zu messen, entweder direkt oder mit dem 
Bootstrapping aus Abschnitt A.2.1, S.438f. Oft muss allerdings der Fehler o der abge- 
leiteten Größe y aus den Fehlern o; der Eingangsgrößen x; abgeschätzt werden, denn 
deren Fehler pflanzen sich in das Ergebnis fort. Hier werden die üblichen Verfahren zur 
Fehlerfortpflanzung aus der Experimentalphysik angesetzt (Taylor 1997, 61). Sind die 
Fehler korreliert, ist der abgeleitete Fehler komplex. Sind die Eingangsfehler allerdings 
(weitgehend) unkorreliert, ist die Berechnung des Ergebnisfehlers einfach: Falls y eine 
Summe oder Differenz der x; ist, gilt 


Zn 


Falls y ein Produkt oder Quotient der x; ist, gilt 


Fi 2: 


Yy zwi 


wobei */y und *i/x, dem relativen Fehler des Ergebnisses y bzw. der Eingangsgrößen 
x; entspricht. Ob Korrelation vorliegt oder nicht, kann mit einem einfachen t-Test auf 
die Signifikanz der Nullhypothese, dass die Pearson-Korrelation Null sei, durchgeführt 
werden (vgl. Abschnitt A.2.5, S.440f., und Gain 1951). Ein abgeleiteter Fehler wird mit 
Doppeldolch ® markiert, so er genau ist, und mit einem einfachen Dolch !, falls er unter 
der Annahme einer Null-Korrelation abgeschätzt wurde. 


A.2.7 Überlappung von Häufigkeitsverteilungen 


Ziel ist es, die Überlappung zweier eindimensionaler Häufigkeitsverteilungsdichten g(x) 
und f(x) zu berechnen. Dies wird mit 


A= | min (f(e),o(a)) da 


angesetzt, was nichts anderes als die Schnittmenge der Flächen ist, die sich durch die 
beiden Verteilungen ergibt. Der sich so ergebende Überlappungskoeffizient A, coefficient 
of overlap, ist 1 bei völliger Identität der Verteilungen. Sind die beiden Verteilungen 
vollständig voneinander getrennt, ergibt sich ein Wert von 0. Die im VOKALJÄGER ange- 
wendete Methode folgt Schmid/Schmidt (2006). Die technische Umsetzung als R-Modul 
stammt von Meredith/Ridout (2014). Die Kernelschätzung basiert auf äquidistanten In- 
tervallen (Äı) und der Fehler wird mittels Bootstrapping errechnet (vgl. Abschnitt A.2.1 
ab S.438). 
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Für empirische Häufigkeitsverteilungen gibt es eine Vielheit von Methoden, Distanz- 
maße bzw. Überlappungen zu ermitteln. Sie finden z.B. Anwendung, wenn die Ker- 
nelschätzer aus der oben eingeführten Methode keine brauchbaren Ergebnisse liefern. 
Cha (2007) allein dokumentiert fünfundvierzig verschiedene Ansätze. Die Bhattacharyya- 
Distanz 


N 
d(x,y) = 1- 3 VE Yi 


in ihrer Form aus Comaniciu/Ramesh (2000, 3) bietet sich an, da sie direkt als Bayes- 
Missklassifikationsfehler interpretiert werden kann und eine Metrik ist. Die ursprüngliche 
Form findet sich in Bhattacharyya (1943). Dabei werden zwei empirische Häufigkeitsver- 
teilungen (x;) und (y;) bestimmt, indem man die (identischen!) Wertebereiche von x bzw. 
yin N äquidistante Bänder aufteilt und auszählt, wie viele Beobachtung aus x und y 
in jedem Band i liegen (x; gibt z.B. die relative Häufigkeit der Beobachtungen aus x 
in Band i an). Die Bhattacharyya-Distanz ist 1, falls x und y in keinem einzigen Band 
gemeinsame Werte haben und 0, falls in jedem Band, das populiert ist, die Häufigkeiten 
identisch sind. Die Wahl der Bandweite bzw. Anzahl der Bänder N ist kritisch. Hier wird 
die in Freedman/Diaconis (1981) vorgeschlagene robuste Form über x und y gemittelt, 
da beide recht unterschiedliche Populationen haben können: 


ie 1 [ %(0,75) — %(0,25) 4 Y(0,75) — Y(0,25) 
2 Me NY 
Dabei werden die Interquartilabstände (0,75) —%(o,25) und die Anzahl der Messpunkte n, 


angesetzt (analog für y). Statistiken der Bhattacharyya-Distanz errechnet man mittels 
Bootstrapping. 
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A.3 Ergänzungen zur Messphonetik 


A.3.1 Die Mathematik des Linear-Prediction-Vokaltraktmodells 


Dieser Abschnitt ist ein Beschreibung der Mathematik des linear prediction models, und 
damit theoretische Grundlage für die Algorithmik der Formanten im VOKALJÄGER. Ein 
Filter ist allgemein durch seine Übertragungsfunktion definiert. Für das Röhrenmodell 
des Vokaltrakts lässt sich die Übertragungsfunktion mit 


1 
vie Sr aprz* 


angeben (Rabiner/Schafer 1978, 82-97). Da im Zähler keine Terme vorkommen, handelt 
es sich um ein Nurpolfilter. Dieses lineare zeitdiskrete Filter wird als Linear-Predicti- 
on-Modell (kurz: LP-Filter) bezeichnet und wurde von Atal/Hanauer (1971) eingeführt 
(Deller u.a. [1992, 266-342] und Rabiner/Schafer [1978, 396-461]). Das LP-Modell ist 
durch seine N reelzahligen linear prediction coeffecients a, (kurz: LP-Parameter) voll- 
ständig beschrieben (der üblicherweise im Zähler stehende Verstärkungsfaktor, gain, ist 
für Form des Spektrums irrelevant und ist hier auf 1 gesetzt). Als Erfahrungswert setzt 
man die Ordnung N des LP-Filters (prediction order) auf die Abtastrate f, in kHz plus 
3 oder 4: „Thus for a 10 kHz simulation, a value |[...] of about 13 or 14 is required“ (Ra- 
biner/Schafer 1978, 419). Die LP-Parameter werden aus dem Lautschallsignal mit einem 
geeigneten Verfahren errechnet. Eine Übersicht findet sich in Deller u.a. (1992, 290-330) 
und Benesty u.a. (2008). 

Das Amplitudenspektrum ist ein Maß dafür, welche Frequenz F' bzw. welche Kreis- 
frequenz 


V(z) (40) 


gan (41) 
Js 
(mit der Abtastfrequenz fs), in dem Lautschallsignal wie stark vertreten ist. Ist das Laut- 
schallsignal durch das Filter V(z) aus Formel (40) beschrieben, ergibt sich das Amplitu- 
denspektrum (genauer: die logarithmierte Betragsamplitude) ganz allgemein aus Loga- 
rithmieren des Betrags von V (z) und Errechnen von z auf dem Einheitskreis z = exp(jw) 
zu 


P(w) = %log (\v (e“) ) (42) 


P(F) = 20log (iv Gz ) 


(Oppenheim/Schafer 1992, 230 und 243). Die Einheit von P(.) ist das Dezibel, abgekürzt 
dB. 

Die LP-Parameter «&; werden selten direkt verwendet um Sprache zu codieren, da nur 
geringe numerische Variationen in den a; starke Veränderungen im Sprachspektrum aus- 
lösen (Rabiner/Schafer 1978, 451). Wohl aber können geeignete Parameter aus den LP- 
Parametern einfach abgeleitet werden (Rabiner/Schafer 1978, 441-444). Dazu gehören 
insbesondere die Nullstellen des Nenners in (40), die für die im nachfolgenden Abschnitt 


bzw. 
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3.2 einzuführenden Formanten von großer Bedeutung sind. Eine direkte Umschreibung 
von (40) ergibt die faktorisierte Darstellung der Übertragungsfunktion 


2 
v@)=]] 


Um) = 


mit 
BZ) (1 re) ®r 2!) (1 pe 7% zu ; 
bei der die reelzahligen LP-Parameter «a, in die konjugiert komplexen Nullstellenpaare 


rk exp(+j x) des Nenners in (40) überführt wurden. Diese Nullstellen (roots) korrespon- 
dieren mit den Übertragungsmaxima bzw. Resonanzfrequenzen 


= Is % 
27 


F, (44) 
des Filters V(z), wobei fs die Abtastfrequenz ist. Ebenso ergeben sich die Bandbreiten 
der Resonanzfrequenzen zu 


B; = nl (45) 


Zu weiteren Details und insbesondere auf die Berechnungsverfahren sei hier auf Rabiner / 
Schafer (1978, 442) und Snell/Milinazzo (1993) verwiesen. 

Das Amplitudenspektrum des Vokaltraktfilters in dieser Darstellung ergibt sich mit 
(42) zu 


N 
P(w) = —20 ’2 log (m (e’“) ) (46) 

k=1 
Das Logarithmieren überführt auf die übliche Skala in Dezibel (dB). Üblicherweise sor- 
tiert man die Resonanzen k = 1,2,... in aufsteigender Frequenz 21 < Na <... Berück- 
sichtigt man nur die erste Resonanz k = 1, ergibt sich das Amplitudenspektrum in erster 


Näherung zu 
Iog ({mı (e'*)|) 


und in zweiter Näherung, die sowohl auf erster und zweiter Resonanz aufsetzt, zu 


(m (*=))) +10 (ma (e*)) 


usw. So ist es möglich, das Amplitudenspektrum Schritt um Schritt durch Hinzunahme 
weiterer Resonanzen bzw. Resonanzfrequenzen und Resonanzbandbreiten, vollständig zu 
konstruieren. Diese Methode das Spektrum so zu konstruieren bzw. zu formen ist we- 
sentliche mathematische Grundlage des Konzepts der Formanten, welches in Abschnitt 
3.2 ab S.42 eingeführt wird. Mit Abbildung 10 auf $.46 findet sich auch eine exemplari- 
sche Veranschaulichung des Konstruktionskonzepts in der Praxis. Ebenso wird es in der 
Sprachsynthese eingesetzt (Deller u.a. 1992, 469-472). 

Eine wichtige Frage ist, ob ein so einfaches Modell wie das LP-Filter, welches auf offen- 
sichtlich stark simplistischen Annahmen - einem verlustfreien Röhrenmodell! — aufsetzt, 
angemessen ist? Die Frage wird von Deller u.a. (1992, 269-270) auch aus rein technischen 
Gründen bejaht. Zum einen ist für jegliche Algorithmik die lineare Struktur im LP-Filter 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


Ergänzungen zur Messphonetik 445 


80- 


ıl FORTE WERE N 
t 1 ) 
200 500 1000 2000 4000 
Frequenz [Hz] 


Abbildung 118: Amplitudenspektrum des [a:] aus Abbildung 6 von S.39. In Grau 
das Spektrum aus einer diskreten 1024-Punkte Fourier Transformation, in Schwarz 
das LP-Amplitudenspektrum der Ordnung N = 13. Deutlich ist zu erkennen wie die 
LP-Parametrisierung wesentliche Elemente des Spektrums durch Glättung herausar- 
beitet. 


(40) von S.443 ideal. Zum anderen ist Sprachinformation nur im Amplitudenspektrum 
des Lautschallsignals zu suchen. Und ein LP-Filter kann das Amplitudenspektrum (aber 
nicht die Phase) exakt abbilden: „If the objective is to code, store, resynthesize, and so 
on, the magnitude spectral characteristics, but not necessarily the temporal dynamics, 
the LP model is perfectly valid and useful“ (Deller u.a. 1992, 269-270). 


Sind die LP Parameter einmal errechnet, kann das Amplitudenspektrum des LP- 
Filters aus der Summendarstellung (40) von $.443 einfach mit 


a \—k 
1- >> Ak (e’®) ) (47) 
k=1 


bestimmt werden (Rabiner/Schafer 1978, 433). Der Term im Betrag |.| ist nichts anderes 
als eine diskrete Fourier-Transformation (DFT) der Ordnung K 


P(w) = —20 log 


K . 
>> ane seh (48) 
k=0 


der Reihe 
(a,) = (1,-a1,-02,...,-aNn_-1, -aN,0,0,...,0,0), 


die aus den N (negierten) LP-Parametern ax besteht, links um eine 1 ergänzt und rechts 
mit Nullen aufgefüllt, bis die gewünschte Länge K, z.B. 1024, erreicht ist (zero padded). 
Sind also die LP-Parameter bekannt, kann mit einer üblichen K-Punkte-DFT sofort das 
Spektrum 

P(w) = —20 log (|\DFT (a;)|) 
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berechnet werden. Da dieses LP-Amplitudenspektrum nur mit wenigen Parametern be- 
schrieben ist, erscheint es gegenüber einem direkt aus dem Lautschallsignal ermittelten 
Spektrum geglättet. Dies ist in Abbildung 118 auf S. 445 exemplarisch dargestellt. Infor- 
mationstechnisch ist dies einfach erklärt: N (z.B. 13) ist wesentlich niedriger als K (z.B. 
1024), womit das LP-Amplitudenspektrum zwangsläufig eine niedrigere Informations- 
dichte hat als das originale Spektrum. Damit fallen genau jene hochfrequenten Einzelhei- 
ten weg, die für das zackige Erscheinungsbild in Abbildung 118 verantwortlich sind, und 
es verbleibt eine glatte Kurve. Aus dem geglätteten LP-Spektrum, was die wesentlichen 
Eigenschaften des eigentlichen Spektrums deutlich herausarbeitet, können nun einfach 
repräsentative Parameter ermittelt werden. Die Maxima gehören dazu, was in Abschnitt 
3.2, S.42f., zu den Formanten aufgegriffen wird. Ebenso einfach ist es, Veränderungen 
des Spektrum bzw. der ihm zugrundeliegenden Parameter zu beobachten. 


Abschließend sei noch darauf hingewiesen, dass das LP-Filter aus Formel (40) von S.443 
— zumindest für Vokale - noch einer weiteren Korrektur bedarf. Das LP-Modell beschreibt 
zwar den Vokaltrakt vollständig, doch kann es als Nurpolfilter die Abstrahlung des Schalls 
an der Mundöffnung bzw. den Lippen, die lip radiation function R(z) nicht abbilden. Das 
Gleiche gilt für die Stimmbandanregung, die glottal transfer function G(z). Setzt man die 
Lippenabstrahlung mit einem 1-Nullstellenfilter R(z) und die Stimmbandanregung mit 
einem 2-Polfilter G(z) an, ergibt sich folgende Anforderung: Es bedarf eines zusätzlichen 
Nullstellenfilters mit genau einer Nullstelle 


P(2)=1=-yuz”! (49) 


um die Effekte von Lippe R(z) (eine Nullstelle) und Stimmband G(z) (zwei Pole) annä- 
hernd zu eliminieren: 


1- urz! 


1 
ea ÜBER) 


P(z) R(z) G(z) = (1 = nz) 


Der Parameter in P(z) wird üblicherweise 0.9 < u < 1 gewählt (Rabiner/Schafer [1978, 
102-103] und Deller u.a. [1992, 329-330]). P(z) rechnet aus dem Signal die Effekte von 
Lippe und Stimmband heraus und erlaubt so die exakte Messung des Vokaltrakts. 

Das Filter P(z) in Formel (49) hebt faktisch höhere Frequenzen um etwa 6dB pro 
steigende Oktave an und wird als Präemphase (preemphasis) bezeichnet. Technisch hat 
diese zu Folge, dass die für den VOKALJÄGER wichtigen Spektralmaxima besser heraus- 
gearbeitet werden. Dies ist exemplarisch in Abbildung 119 auf $S. 447 dargestellt. 


A.3.2 Formantdiagramme 


Die hier verwendeten zweidimensionalen Formantdiagramme stellen jeweils ein Koordi- 
natensystem aus zwei Formanten dar (vgl. Beispielbild unten). Die x-Achse entspricht in 
der Regel F2, die y-Achse F1 oder F3. Die Achsen sind invertiert, um eine visuelle Ähn- 
lichkeit mit dem phonologischen Formantviereck zu erzeugen. Die untere und die linke 
Achse sind die maßgeblichen. Sie sind in äquidistanten Bark-Schritten notiert und damit 
pseudo-logarithmisch bezüglich der originalen Werte in Hertz. Die obere und rechte Achse 
spiegeln jeweils untere und linke Achse die Markierungen in Bark, allerdings nach Hertz 
rückkonvertiert. Aus diesem Grund erscheinen die Zahlenmarkierungen der Achsen, die in 
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Abbildung 119: Geglättetes Amplitudenspektrum aus Abbildung 118 nach Prä- 
emphase (dicke schwarze Linie). Deutlich zu erkennen ist die Anhebung der höheren 
Frequenzen gegenüber dem LP Spektrum bzw. DFT Spektrum vor Präemphase (glat- 
te bzw. zackige Linie in grau). Das Spektrum nach Präemphase kann zur einfachen 
Ermittlung der Übertragungsmaxima — der Höcker im Spektrum — genutzt werden. 


Bark notiert sind (unten, links), in äquidistanten (Bark) Schritten, wohingegen die Ska- 
len in Hertz (oben, rechts) nicht äquidistant sind. In die meisten Formantdiagramme ist 
das Normtetragon gestrichelt eingezeichnet. Dieses zeigt den erwarteten Formantbereich 
an (vgl. Abschnitt 3.6.9 ab S.93). Die Eckpunkte wurden auf die gesamte hochdeut- 
sche Testgruppe HG1 kalibriert und es ergeben sich die Werte in Tabelle 10 auf $.120. 
Ebenso ist das 99%-Extremdreieck eingezeichnet. Innerhalb dieses Dreiecks liegen ca. 
97% der Messwerte. Es ist geschlechtsabhängig kalibriert und wird für die Rückfaltung 
extremer Messwerte genutzt (vgl. Tabelle 9 auf S.120 zu den errechneten Eckpunkten). 
Der eingezeichnete Kasten entspricht dem Bereich, der innerhalb der unteren und oberen 
Perzentilmittel der Werte der beiden Achsen liegt (vgl. Abschnitt 3.6.2 ab S. 86). 
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A.3.3 Alternative Transformationen auf Bark 


Traunmüller (1990) gibt für die Transformation auf Bark die alternative Darstellung 
NBark-2(E}) = 00 0 — 0,53 
an. Weitere Alternativen finden sich bei Schroeder (1977) mit 


A F; 
NBark-3(F5) = 7arcsinh (5) 
und bei Terhardt (1979) mit 


NBark-a(F5) = 12,82 arctan (0,78 Fj) + 0,17 Ru, 


A.3.4 Die Mel- und ERB-Skalierung 


Die Mel-Transformation 


F:; 
nMel(#5) = 1.127 In ( a an) 


wird von Stevens/Volkmann (1940) vorgeschlagen. Der auditorische Wert wird in Mel 
angegeben und aus der Formantfrequenz F,; in Hertz errechnet. Die Umkehrfunktion 
lautet > 

nn. (N) = 700 (er _ 1) 


mit der Formantfrequenz M in Mel. Die auditorische equivalent rectangular bandwidth 
(ERB) Transformation nach Glasberg/Moore (1990) lautet: 


NnERB(F}) = 21Aln(1+ 0,00437 F';) : 


A.3.5 Neareys Uniforme Verschiebung 


Nearey (1978, 95) schlägt eine uniforme Verschiebung der F1/F2-Formantfrequenzen um 
ihren Mittelwert, Formel (17), mit 


F— utF5} (50) 


vor. Er verschiebt mit dieser Methode die F1/F2-Formantebene, was er als sliding templa- 
te bezeichnet. Diese Methode entspricht Lobanov-Normalisierung unter der normativen 
Annahme einer Standardabweichung von 1, bzw. einer einheitlichen Streubreite. Im Ori- 
ginaltext von Nearey werden die Formanten vorher mit Formel 11 auf S.76 auf eine 
logarithmische auditorische Skala transformiert. Das Verfahren lässt sich aber auch mit 
anderen auditorischen Skalen verwenden. Das Normalisierungsverfahren nach Nearey ist 
eine spezielle Form des Z-Werts, Formel 16 auf S.82, in welchem die Streuung a nor- 
mativ auf 1 gesetzt wurde. Flynn/Foulkes (2011, 686) sortieren Neareys Methode als 
vokalextrinsisch, sprecherintrinsisch und formantintrinsisch ein. Anwendungen der Me- 
thode finden sich etwa bei Barreda (2013) und, in erweiterter Form, in Labovs Atlas of 
North American English. 
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A.A4.1 Weiteres zur Merkmalswertformel 


Die Formel des Merkmalswert (35) von S.171 hat noch einen anderen Zugang: Man kann 
den Merkmalswert, falls sicher bekannt ist, welche Elementarausprägung i° vorliegt, als 


N 
m -1(i=i°) 
i=1 


schreiben. Die Indikatorfunktion 1 (i = i”) hat nur genau dann und nur einmal den Wert 
1, falls © = i® ist und sonst immer 0. In dieser Schreibweise wird der Merkmalswert aus 
binären Indikatoren und den Elementarausprägungen zusammengesetzt. Ist die Elemen- 
tarausprägung nicht sicher bekannt, muss die Indikatorfunktion durch eine Wahrschein- 
lichkeitsfunktion p; ersetzt werden und es entsteht Formel (35). 

Auch muss nicht jede Elementarausprägung nur genau einmal auftreten. Es kann 2. B. 
hilfreich sein, mehrere Modelle bzw. Wahrscheinlichkeitsfunktionen p(.) für denselben 
Wert m anzusetzen, also 


N di 
(e)= Im) ar Pijlile): 
i=1 Mi j 


Dieser Ansatz mittelt über J; verschiedene Wahrscheinlichkeitsfunktionen p;,;(), um Ro- 
bustheit und Genauigkeit bei der Schätzung von i zu erhöhen (more of the same kind). 
Dabei sind die a;,; Gewichtsfaktoren. Konzeptionell handelt es sich hier um das von 
Breiman (1996) eingeführte Konzept des Baggings. 


A.4.2 Merkmalsdifferenz zum Hochdeutschen 


Ergänzend wird die Merkmalsdistanz 
AcHD — <- au 


zwischen dem üblichen ( eines Sprechers aus Formel (36) von $.183 und einem sprecher- 
extrinsisch erwarteten (HP für das Hochdeutsche errechnet. Es gelte 


ge (51) 
Der Normwert (HP ist das Zentrum bzw. der Median der Merkmalswerte (HP der hoch- 
deutschen Sprecher k. 

Es werden hier konzeptionell dieselben Kriterien zur Signifikanz des Unterschieds 
angesetzt, die auch für sprecherintrinsische Berechnungen aus Abschnitt 5.2.2, S. 185f., 
gelten. Die Abschätzung der Signifikanz erfolgt hier allerdings vereinfacht: Es wird mit- 
tels Bootstrapping sprecherintrinsisch die Verteilung der ( und aD errechnet, was eine 
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Distanzen zum Hochdeutschen: Öffnungsstufe O-Laute 


[o:] - ha. [o] 


[0:] - hd. [o:] 


1- 


Signifikanz 


T T T T T T T T T T T T I] 
X jn4 je [14 jn4 jn4 
sah a = = sah a = = .% 
DS, DS = RS {62} S D = N 3 S 
S © © S S ja} S © © S S a Os 
N4 N4 N4 N4 x I N4 N4 N4 N4 x I 
+ ns 
x th 
[9] - ha. [o:] 


B—— 
Su —— 
1 — 


3 
1,3 
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K61BE 
K62BE 
KO9MR 
HD 
K07MR 
K61BE 
K62BE 
KO9MR 
K10MR 
HD 


Abbildung 120: Beispiel O-Laute: Vergleich des Merkmalswerts ( einzelner Spre- 
cher mit dem mittleren Merkmalswert hochdeutscher Sprecher. Das mit dem Symbol 
gekennzeichnete Ende des vertikalen Strichs zeigt den Merkmalswert des Sprechers 
für den Referenzlaut an (das ist das linke Lautsymbol, z.B. ‚[o:]‘ für den langen 
O-Laut als Referenz im Schaubild links oben). Das mit dem horizontalen Strich ge- 
kennzeichnete Ende markiert ( des hochdeutschen Vergleichslauts (das ist das rechte 
Lautsymbol, z.B. ‚hd. [5] im Schaubild links oben). Die Länge des vertikalen Strichs 
bzw. die Zahl ist die Differenz ACHP bezüglich des gleitenden Merkmals (hier: Öff- 
nungsstufe der Hinterzungenvokale). Referenz- und Vergleichslaut gelten als unter- 
schiedlich, falls die Distanz ACHP signifikant ist (**: hoch signifikant; «: signifikant; 
‚ls‘: vermeintlich signifikant, aber zu geringe Probenzahl; ‚th‘: Minimaldistanz nicht 
erreicht; ‚ns‘: nicht signifikant). Die meisten Merkmalswerte der hochdeutschen Ein- 
zelsprecher weisen die erwartete Distanz zum hochdeutschen Mittel auf: Die langen 
O-Laute weichen von der hochdeutschen Norm der kurzen [5] um ACHP = 1 ab 
(links oben). Auch liegt die erwartete Nicht-Abweichung der langen O-Laute von der 
hochdeutschen Norm der langen [o:] vor (rechts oben: ( = 0). Einzig im umgekehrten 
Fall findet sicht für den schon auffällig gewordenen Sprecher K62BE eine signifikan- 
te Abweichung (links unten: der kurze O-Laut liegt um ACHP = 0,3 unterhalb der 
hochdeutschen Norm des [>]). 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


Ergänzungen zur Klassifikationsphonetik 451 


Verteilung von Medianen ist (N = 5.000). Daraus ergeben sich die a-Ordnungsstatistiken 
bzw. Perzentile C..,) und Cara) Aus letzteren kann ein robustes ‚Mittel‘ 


Ge = (Ce) 
über alle hochdeutschen Sprecher errechnet werden, wobei 
EP = cs) 
ist. Zur Ermittlung z.B. der 99%-Signifikanz wird getestet, ob 
Coon) > ((0,99) unter der Annahme, dass (IP >c 


usw. 

ACHP hat hauptsächlich ergänzenden und informativen Charakter, denn aus einer 
sprecherextrinsischen Verzerrung gegenüber dem Hochdeutschen kann nicht sofort auf 
ein sprecherintrinsisches dialektales Muster geschlossen werden: dies muss sich erst aus 
signifikanten Differenzen zwischen Laut- bzw. Wortgruppen bestätigen (vgl. Abschnitt 
5.2.2 ab $S.185). Schaubild 120 auf S.450 veranschaulicht die Berechnung. 


A.4.3 Zur minimalen Probenzahl 


Pauschal werden Paare über Gruppen mit jeweiliger Probenzahl n; und Wortzahl w; als 
zu gering populiert angesetzt, falls min(nı,na) + min(wı, wa) < 4. Faktisch markiert die- 
se Heuristik Gruppen mit nur einem Stamm als nicht signifikant, wenn die Probenzahl 
n < 3 ist. Falls eine vermeintliche Signifikanz vorliegt, wird eine minimale Probenzahl 
nach Krzywinski/Altman (2013), Bock (1998) und Scherer (2015) mit einem pauschali- 
sierten t-Test abgeschätzt, wobei ein Signifikanzniveau von 95% bzw. 99% (alpha) sowie 
die übliche Teststärke von 80% (power) angesetzt wird. Die (-Standardabweichung wird 
hier fix auf den Wert 0,15 gesetzt, was dem gemessenen Median der MADs der relevanten 
Referenzstämme entspricht. Der fixe Wertansatz wurde gewählt, da viele Referenzstäm- 
me zu gering populiert sind, eine von Null verschiedene Standardabweichung empirisch zu 
bestimmen. Dieser Ansatz ist bewusst abhängig von der Merkmalsdifferenz AC® gewählt: 
Die Anforderung an die minimale Probenzahl steigt umso mehr, desto geringer der ge- 
messene Abstand ist. Pauschal zu niedrige Populationen werden immer mit ‚Is‘ markiert. 
Wenn vermeintliche Signifikanz gemessen wurde, wird gegebenenfalls mit ‚ls‘ markiert; 
falls keine Signifikanz vorlag, verbleibt unabhängig von der minimalen Probenzahl ‚ns‘. 


A.4.4 Cohens Kappa 


Kappa wurde von Cohen (1960) eingeführt, um ein Maß für die Übereinstimmung zwei 
urteilender Parteien zu schaffen. Im Rahmen der mathematischen Statistik bzw. Klas- 
sifikation wird Kappa interpretiert als eine Erkennungsrate, die um die Erkennungen 
korrigiert wurde, die rein zufällig sind und nicht auf der Qualität des Klassifikators beru- 
hen (Kuhn/Johnson [2013, 255] und Grouven u.a. [2007]). Mathematisch gilt für Kappa 


G-E 
ter’ 


K 
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wobei G die gemessene nominale Genauigkeit und E die erwartete zufällige Genauigkeit 
ist, die sich aus der Verteilung der erwarteten bzw. nicht erwarteten Zustände ergibt. 
Kappa liegt im Bereich von -1 bis 1, wobei 1 der Idealfall ist. 


A.4.5 Kalibrieren der Schaltschwelle (zu 5.4.5) 


Der Klassifikator errechnet, gegeben eine Lautprobe ;, eine originale Pseudowahrschein- 
lichkeit r;. Diese Pseudowahrscheinlichkeit liegt im Bereich 0 bis 1. Je höher r;, desto 
wahrscheinlicher ist es, dass das dem Klassifikator zugrundeliegende Merkmal in der 
Lautprobe vorliegt. Doch ab welchem Wert r; soll binär entschieden werden, dass das 
Merkmal vorliegt oder eben nicht? Dieser Wert ist die Schaltschwelle c. Die folgenden 
Schritte beschreiben, wie die Schaltschwelle im VOKALJÄGER optimal kalibriert wird. 


1. Für einen Kontrastlaut k wird erwartet, dass das Schätzermodell mit einem niedrigen 
r; anzeigt, dass das Binärmerkmal nicht vorliegt. Ist allerdings r; > c, macht das 
Modell einen Fehler. Die gesamte Fehlerrate bei der Klassifikation eines Kontrastlauts 
k ist 


= 1 1 : rn >ec Fehlklassifikation! 
&(c) ei a 


wobei N; die Anzahl der Lautproben i ist, die für den Kontrastlaut k vorliegen. 


2. Für einen Stützlaut ist die Situation analog, aber umgekehrt: Es wird erwartet, dass 
das Schätzermodell mit einem hohen r; anzeigt, dass das Binärmerkmal vorliegt. Ist 
allerdings r; < c, macht es einen Fehler. Der gesamte Fehler bei der Klassifikation 
eines Stützlauts s ist 


0 14.2 
ie ah 2a i 
zz N; > | 1 : 7;<ce Fehlklassifikation!, 
wobei N, die Anzahl der Lautproben :i ist, die für den Stützlaut s vorliegen. 


3. Es wird nun jeweils für die Kontrastlaute und die Stützlaute der maximale Fehler 


mit 

erleh= max e, (e) 
und 

e’(e) = max ei (ec) 
errechnet. 


4. Daraus ergibt sich ein totaler maximaler Fehler 


&(c) = max (e* (c),e (c)) . 


5. Die gesuchte optimale Schwelle c* sei nun der Wert, für den der totale Fehler minimal 
ist: 


Dell) min &(c). 
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Abbildung 121: Skalierungsgewicht, abhängig von einer Noise-gate-Schwelle c und 
einem Verstärkungsfaktor b, welches auf die originalen Pseudowahrscheinlichkeiten 
angewendet wird. Für b— 0 verschwindet die Verstärkung und alle Wahrscheinlich- 
keiten werden gleich angesetzt. Wahrscheinlichkeiten unterhalb von c werden auf 0 
gesetzt bzw. ausgeblendet. Die Werte im VOKALJÄGER sind c = 0,25 und b = 0,1. 


Dies korrespondiert damit jene Schwelle zu finden, für die tendenziell am wenigsten 
Fehler gemacht werden — und zwar sowohl für die Stützlaute als auch die Kontrast- 
laute!?2. 


A.4.6 Kalibrieren der Pseudowahrscheinlichkeiten (zu 5.4.6) 


Dieser Abschnitt beschreibt, wie die originären Pseudowahrscheinlichkeiten, die das Schät- 
zermodell errechnet hat, so reskaliert werden, dass sie für die Nutzanwendung im VOo- 
KALJÄGER optimal sind: 


1. Zuerst wird im VOKALJÄGER die originäre Pseudowahrscheinlichkeit ro so angepasst, 
dass der Zahlenwert, an dem das Schätzermodell vom Nicht-Vorliegen des Merkmals 
auf Vorliegen des Merkmals schaltet, exakt bei 0,5 liegt. Dies ist eine einfache bilineare 
Reskalierung unter Nutzung der in Abschnitt A.4.5, S.452f., gefundenen optimalen 
Schaltschwelle c*. Falls rg < c*, gelte 


r=0,5. 
c 
und falls rg > c*, gelte 
ro = c* 
1 =0,5405: Tr: 


152Dje Implementierung im VOKALJÄGER ist etwas komplexer als hier dargestellt, da Robust- 
heit sichergestellt werden muss. So wird die optimale Schwelle technisch als Mittelwert der beiden 
Schwellenwerte errechnet, die mit den beiden Fehlern korrespondieren, die 1,02-fach über dem 
Minimalfehler liegen. Auch wird erzwungen, dass die endgültige Schwelle zwischen 0,001 und 
0,999 liegt. 
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Dieser Schritt führt eine normalisierte Schaltschwelle von 0,5 an, die es erlaubt, mo- 
dellübergreifend rı hinsichtlich des Vorliegens oder Nicht-Vorliegens eines Merkmals 
heranzuziehen. 


2. In einem nächsten Schritt wird eine eventuell in rı noch vorhandene Wertebereichs- 
verzerrung eliminiert, mdem der Wertebereich mit 


0 rı <rı (0,01) 
0,5-(rı - (0,01): (0,5 -r1(00)) ri) <rı<0,B 
0,5+0,5- (rı - 0,5) - (rı (0,99) — 0,5)" 0,5<rı <rı (0,99) 
1 rı 2 r1 (0,99) 


rn7= 


auf 0 bis 1 aufgespreizt wird. Erreicht wird dies durch eine Skalierung auf r; (o,01) und 
r1 (0,99), das 1%- und 99%-Perzentil der Daten, und entsprechendes Kappen der un- 
tersten und obersten 1%!?®. Man beachte, dass diese Transformation die normalisierte 
Schaltschwelle von 0,5 unberührt lässt. 


3. Es werden nun größere Pseudowahrscheinlichkeiten verstärkt und die, die unterhalb 
einer Noise-Gate-Schwelle c liegen, ausgeblendet: 


ER 0 : nm<c 
in (sehe a 


Die Verstärkung wird über den Stellwert b gesteuert (c = 0 und b = 0 deaktivieren 
das Noise-Gate). Man beachte, dass die resultierende Pseudowahrscheinlichkeit auch 
wieder den Wertebereich 0 bis 1 hat. Abbildung 121 auf S.453 zeigt die Auswirkung 
verschiedener Stellwerte b und c. Für den VOKALJÄGER wird der Stellwert c = 
0,25 gesetzt, was Pseudowahrscheinlichkeiten, die unter 0,25 liegen, ausblendet. Der 
Verstärkungsstellwert wird auf ein moderates b = 0,1 gesetzt. Mit diesen Stellwerten 
konnten sehr gute Übereinstimmungen mit den erwarteten Werten erreicht werden 
und insbesondere die quantale Struktur der Referenz, des Hochdeutschen, abgebildet 
werden (vgl. Abschnitt 6.2 ab $S.226). Bei der Wahl alternativer Klassifikatoren, z.B. 
anderer Schätzermodelle als die S-mda, muss entsprechend umkalibriert werden. 


4. Im letzten Schritt werden die Pseudowahrscheinlichkeiten r3.; pro Lautprobe x jeweils 
über alle Klassifikatoren i im Ensemble auf 1 normiert: 


r3,(2) 


Yırz;(e) 


Das Ergebnis ist die Pseudowahrscheinlichkeit p;(x), die in die zentrale Formel (35) 
von 8.171 eingeht. 


pi(z) = 


153 Alternativ wäre die Verwendung des Maximums, doch ist dies nicht robust gegenüber Aus- 
reißern. 
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F3 (MAD normalisiert und rückprojiziert 
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Abbildung 122: Boxplot-Statistik der Formanten Fl, F2 und F3 nach robuster 
MAD-Normalisierung und Rückprojektion. Jeweils über alle Sprecher. Die Skala ist 
in Hertz. 
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Abbildung 123: Initiale Merkmalswerte C° pro Lautprobe der kurzen O-Laute 
(Gruppe 0) hinsichtlich des gleitenden Merkmals der Öffnungsstufe der Hinterzun- 
genvokale. Die Proben (Symbole) sind bezüglich ihres Referenzstamms gruppiert (y- 
Achse) und der vertikale Strich markiert den Median C! der Gruppe. Die Zahl und 
die gestrichelte Linie zeigt den Median der Gruppenmediane — das ist der Merkmals- 
wert ( in den Abbildungen des Hauptteils. ‚W1‘ weist mittels Symbol aus, welcher 
Binärklassifikator die höchste Wahrscheinlichkeit hat. 
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Abbildung 124: Initiale Merkmalswerte (° pro Lautprobe der langen O-Laute 
(Gruppe 0:) hinsichtlich des gleitenden Merkmals der Öffnungsstufe der Hinterzun- 
genvokale. Die Proben (Symbole) sind bezüglich ihres Referenzstamms gruppiert (y- 
Achse) und der vertikale Strich markiert den Median (! der Gruppe. Die Zahl und 
die gestrichelte Linie zeigt den Median der Gruppenmediane — das ist der Merkmals- 
wert C in den Abbildungen des Hauptteils. ‚W1‘ weist mittels Symbol aus, welcher 
Binärklassifikator die höchste Wahrscheinlichkeit hat. 
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Abbildung 125: Initiale Merkmalswerte C pro Lautprobe der O-Laute vor in- 
tervokalischem oder auslautendem R (Gruppe O:-r) hinsichtlich des gleitenden 
Merkmals der Öffnungsstufe der Hinterzungenvokale. Die Proben (Symbole) sind be- 
züglich ihres Referenzstamms gruppiert (y-Achse) und der vertikale Strich markiert 
den Median C! der Gruppe. Die Zahl und die gestrichelte Linie zeigt den Median der 
Gruppenmediane — das ist der Merkmalswert ( in den Abbildungen des Hauptteils. 
‚W1‘ weist mittels Symbol aus, welcher Binärklassifikator die höchste Wahrschein- 
lichkeit hat. 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 
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Abbildung 126: Initiale Merkmalswerte (° pro Lautprobe der O-Laute vor R und 
Konsonant (Gruppe 0-rC) hinsichtlich des gleitenden Merkmals der Öffnungsstufe 
der Hinterzungenvokale. Die Proben (Symbole) sind bezüglich ihres Referenzstamms 
gruppiert (y-Achse) und der vertikale Strich markiert den Median C! der Gruppe. 
Die Zahl und die gestrichelte Linie zeigt den Median der Gruppenmediane — das ist 
der Merkmalswert ( in den Abbildungen des Hauptteils. ‚W1‘ weist mittels Symbol 
aus, welcher Binärklassifikator die höchste Wahrscheinlichkeit hat. 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 
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Abbildung 127: Initiale Merkmalswerte (® pro Lautprobe des kurzen A-Lauts 
(Gruppe A) hinsichtlich des gleitenden Merkmals der Öffnungsstufe der Hinterzun- 
genvokale. Die Proben (Symbole) sind bezüglich ihres Referenzstamms gruppiert (y- 
Achse) und der vertikale Strich markiert den Median C! der Gruppe. Die Zahl und 
die gestrichelte Linie zeigt den Median der Gruppenmediane — das ist der Merkmals- 
wert ( in den Abbildungen des Hauptteils. ‚W1‘ weist mittels Symbol aus, welcher 
Binärklassifikator die höchste Wahrscheinlichkeit hat. 
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Abbildung 128: Initiale Merkmalswerte (° pro Lautprobe des altlangen A (Grup- 
pe Ä) hinsichtlich des gleitenden Merkmals der Öffnungsstufe der Hinterzungenvokale. 
Die Proben (Symbole) sind bezüglich ihres Referenzstamms gruppiert (y-Achse) und 
der vertikale Strich markiert den Median C! der Gruppe. Die Zahl und die gestrichelte 
Linie zeigt den Median der Gruppenmediane - das ist der Merkmalswert (in den Ab- 
bildungen des Hauptteils. ‚W1‘ weist mittels Symbol aus, welcher Binärklassifikator 
die höchste Wahrscheinlichkeit hat. 
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Abbildung 129: Initiale Merkmalswerte C° pro Lautprobe des Dehnungs-A 
(Gruppe Az) hinsichtlich des gleitenden Merkmals der Öffnungsstufe der Hinterzun- 
genvokale. Die Proben (Symbole) sind bezüglich ihres Referenzstamms gruppiert (y- 
Achse) und der vertikale Strich markiert den Median (! der Gruppe. Die Zahl und 
die gestrichelte Linie zeigt den Median der Gruppenmediane — das ist der Merkmals- 
wert ( in den Abbildungen des Hauptteils. ‚W1‘ weist mittels Symbol aus, welcher 
Binärklassifikator die höchste Wahrscheinlichkeit hat. 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 
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Abbildung 130: Initiale Merkmalswerte C° pro Lautprobe des jungen langen A 
(Gruppe Ar-mod) hinsichtlich des gleitenden Merkmals der Öffnungsstufe der Hinter- 
zungenvokale. Die Proben (Symbole) sind bezüglich ihres Referenzstamms gruppiert 
(y-Achse) und der vertikale Strich markiert den Median (' der Gruppe. Die Zahl und 
die gestrichelte Linie zeigt den Median der Gruppenmediane — das ist der Merkmals- 
wert C in den Abbildungen des Hauptteils. ‚W1‘ weist mittels Symbol aus, welcher 
Binärklassifikator die höchste Wahrscheinlichkeit hat. 
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Abbildung 131: Initiale Merkmalswerte (° pro Lautprobe des kurzen dunklen 
A (Gruppe kdA) hinsichtlich des gleitenden Merkmals der Öffnungsstufe der Hinter- 
zungenvokale. Die Proben (Symbole) sind bezüglich ihres Referenzstamms gruppiert 
(y-Achse) und der vertikale Strich markiert den Median (! der Gruppe. Die Zahl und 
die gestrichelte Linie zeigt den Median der Gruppenmediane — das ist der Merkmals- 
wert ( in den Abbildungen des Hauptteils. ‚W1‘ weist mittels Symbol aus, welcher 
Binärklassifikator die höchste Wahrscheinlichkeit hat. 
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Abbildung 132: Initiale Merkmalswerte (° pro Lautprobe des Monophthon- 
gierungs-A (Gruppe MA) hinsichtlich des gleitenden Merkmals der Öffnungsstufe 
der Hinterzungenvokale. Die Proben (Symbole) sind bezüglich ihres Referenzstamms 
gruppiert (y-Achse) und der vertikale Strich markiert den Median C! der Gruppe. 
Die Zahl und die gestrichelte Linie zeigt den Median der Gruppenmediane — das ist 
der Merkmalswert ( in den Abbildungen des Hauptteils. ‚W1‘ weist mittels Symbol 
aus, welcher Binärklassifikator die höchste Wahrscheinlichkeit hat. 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 
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Abbildung 133: Initiale Merkmalswerte (° pro Lautprobe des Monophthongie- 
rungs-A vor Nasalen (Gruppe MA-N) hinsichtlich des gleitenden Merkmals der 
Öffnungsstufe der Hinterzungenvokale. Die Proben (Symbole) sind bezüglich ihres 
Referenzstamms gruppiert (y-Achse) und der vertikale Strich markiert den Median 
C! der Gruppe. Die Zahl und die gestrichelte Linie zeigt den Median der Gruppenme- 
diane — das ist der Merkmalswert ( in den Abbildungen des Hauptteils. ‚W1‘ weist 
mittels Symbol aus, welcher Binärklassifikator die höchste Wahrscheinlichkeit hat. 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 
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Abbildung 134: Initiale Merkmalswerte (° pro Lautprobe des A vor -LT (Gruppe 
A-1t) hinsichtlich des gleitenden Merkmals der Öffnungsstufe der Hinterzungenvoka- 
le. Die Proben (Symbole) sind bezüglich ihres Referenzstamms gruppiert (y-Achse) 
und der vertikale Strich markiert den Median (! der Gruppe. Die Zahl und die ge- 
strichelte Linie zeigt den Median der Gruppenmediane — das ist der Merkmalswert 
GC in den Abbildungen des Hauptteils. ‚W1‘ weist mittels Symbol aus, welcher Binär- 
klassifikator die höchste Wahrscheinlichkeit hat. 
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Abbildung 135: Initiale Merkmalswerte C” pro Lautprobe der langen I-Laute 


(Gruppe Ir) hinsichtlich des gleitenden Merkmals des Rundungsgrads der Vorder- 
zungenvokale. Die Proben (Symbole) sind bezüglich ihres Referenzstamms gruppiert 
(y-Achse) und der vertikale Strich markiert den Median (! der Gruppe. Die Zahl und 
die gestrichelte Linie zeigt den Median der Gruppenmediane — das ist der Merkmals- 
wert ( in den Abbildungen des Hauptteils. ‚W1‘ weist mittels Symbol aus, welcher 
Binärklassifikator die höchste Wahrscheinlichkeit hat. 


Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 
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Abbildung 136: Initiale Merkmalswerte C° pro Lautprobe der langen E-Laute 
(Gruppe Er) hinsichtlich des gleitenden Merkmals des Rundungsgrads der Vorder- 
zungenvokale. Die Proben (Symbole) sind bezüglich ihres Referenzstamms gruppiert 
(y-Achse) und der vertikale Strich markiert den Median (' der Gruppe. Die Zahl und 
die gestrichelte Linie zeigt den Median der Gruppenmediane — das ist der Merkmals- 
wert C in den Abbildungen des Hauptteils. ‚W1‘ weist mittels Symbol aus, welcher 
Binärklassifikator die höchste Wahrscheinlichkeit hat. 
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Zusätzliche Messergebnisse 473 


FraLD KG1 KG2 K07MR 
ueber2- | stuetzen - H 
| tuer - } 
vebar- $ schoen2 - schoen - ! 
I 
schoen - k}hl = + 
gemuet - $ ı 
N moeglich - 1 
fuehrer - ruebe - gryn - | 
| hoehe -| | 
frueher - ö \ 
ı gemuese -| begr}-t - N 
J ı 
brueder 6 frueher - [median] - 1 
I ’ 
: median] - 0 
[median] = | [median] - ! 1 2 
10 15 2,0 
K61BE 
T T T 
st}hle - st}hle - j \ 
t tuer - ? tuer - J 
spueren -| + spueren -| t ı | 
1 ı I 
s}-igkeiten -, + s}-igkeiten -, 4 i Khl - 4 h Kin - N 
ı ı 
grnt - annt- N ı ı 
fr}hst}ck - fr}hst}ck -| \ grin - } grin - N 
fr}hlingswetter - fr}hlingswetter - + N N 
dr}ben - dr}ben - | begr)-t = ’ begr}-t = t 
1 ı ı 
bi}hen - bi}hen - N ! N 
| [median] - 2,0 |fmedian] - 2,0 
[median] - [median] - 2, ı ı 
T T t T T t T T t wi 
10 15 20 10 15 20 2,5 10 15 20 2,5 10 15 20 25 lo'nRndFrnt 
FraLC FraFJ1 FraF2L FraF3L e RndFrnt 
T T 
1 ı ı 
- ! ueber -| wuerden - n 4 
ueber ı kuehe - } ! 
i ueber -| i 4 
' mued - N ' 
mued - I ) 1 1 
\ fuesse - © : mued -; 1 + 
N kuehe - 1 1 
kuehe - ? ! \ kuehe - r) .'n 
1 ı ı 
ı fuesse -| + ı 
I frueher - fuesse - & 1 
fuesse - | N h H 
i frueher - | früeker- + n 
1 ı ı 
ne 1 i [median] - 2,0 } 
[median] 1 [median] -, | [median] - ı 1,8 
T T t T LKEREHIEE 
10 15 2,0 10 15 20 25 10 15 20 25 
FraF4L FraFA2L 
wuerden -| - t ueber - wuerden -| - N 
ı ı 
ı 
ber - ber - 
ueber {) age ueber } 
pP 1 
mued - Po mued - t 
h kuehe - R 
kuehe - \ kuehe - N 
ı 1 
1 fuesse -| 1 
- I - ı 
fuesse d ' fuesse ' h 
ı ı 
frueher - 
frueher- & ı a frueher- $ 1 
ı ı 
[median] - ı [median] =; [median] -— ı 1,6 
10 15 2,0 


Abbildung 137: Initiale Merkmalswerte C pro Lautprobe der Laute mit hoch- 
deutsch langer Ü-Entsprechung (Gruppe Üz) hinsichtlich des gleitenden Merk- 
mals des Rundungsgrads der Vorderzungenvokale. Die Proben (Symbole) sind be- 
züglich ihres Referenzstamms gruppiert (y-Achse) und der vertikale Strich markiert 
den Median C' der Gruppe. Die Zahl und die gestrichelte Linie zeigt den Median der 
Gruppenmediane — das ist der Merkmalswert ( in den Abbildungen des Hauptteils. 
‚W1‘ weist mittels Symbol aus, welcher Binärklassifikator die höchste Wahrschein- 
lichkeit hat. 
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Abbildung 138: Initiale Merkmalswerte C° pro Lautprobe der Laute mit hoch- 
deutsch langer Ö-Entsprechung (Gruppe Öz) hinsichtlich des gleitenden Merk- 
mals des Rundungsgrads der Vorderzungenvokale. Die Proben (Symbole) sind be- 
züglich ihres Referenzstamms gruppiert (y-Achse) und der vertikale Strich markiert 
den Median (! der Gruppe. Die Zahl und die gestrichelte Linie zeigt den Median der 
Gruppenmediane — das ist der Merkmalswert ( in den Abbildungen des Hauptteils. 
‚W1‘ weist mittels Symbol aus, welcher Binärklassifikator die höchste Wahrschein- 
lichkeit hat. 
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Abbildung 139: Initiale Merkmalswerte C° pro Lautprobe der kurzen I-Laute 
(Gruppe I) hinsichtlich des gleitenden Merkmals des Rundungsgrads der Vorder- 
zungenvokale. Die Proben (Symbole) sind bezüglich ihres Referenzstamms gruppiert 
(y-Achse) und der vertikale Strich markiert den Median (! der Gruppe. Die Zahl und 
die gestrichelte Linie zeigt den Median der Gruppenmediane — das ist der Merkmals- 
wert ( in den Abbildungen des Hauptteils. ‚W1‘ weist mittels Symbol aus, welcher 
Binärklassifikator die höchste Wahrscheinlichkeit hat. 
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Abbildung 140: Initiale Merkmalswerte (° pro Lautprobe der kurzen E-Laute 
(Gruppe E) hinsichtlich des gleitenden Merkmals des Rundungsgrads der Vorder- 
zungenvokale. Die Proben (Symbole) sind bezüglich ihres Referenzstamms gruppiert 
(y-Achse) und der vertikale Strich markiert den Median (' der Gruppe. Die Zahl und 
die gestrichelte Linie zeigt den Median der Gruppenmediane — das ist der Merkmals- 
wert C in den Abbildungen des Hauptteils. ‚W1‘ weist mittels Symbol aus, welcher 
Binärklassifikator die höchste Wahrscheinlichkeit hat. 
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Abbildung 141: Initiale Merkmalswerte ( pro Lautprobe der Laute mit hoch- 
deutsch kurzer Ü-Entsprechung (Gruppe Ü) hinsichtlich des gleitenden Merk- 
mals des Rundungsgrads der Vorderzungenvokale. Die Proben (Symbole) sind be- 
züglich ihres Referenzstamms gruppiert (y-Achse) und der vertikale Strich markiert 
den Median C' der Gruppe. Die Zahl und die gestrichelte Linie zeigt den Median der 
Gruppenmediane — das ist der Merkmalswert ( in den Abbildungen des Hauptteils. 
‚W1‘ weist mittels Symbol aus, welcher Binärklassifikator die höchste Wahrschein- 
lichkeit hat. 
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Abbildung 142: Initiale Merkmalswerte C° pro Lautprobe der Laute mit hoch- 
deutsch kurzer Ö-Entsprechung (Gruppe Ö) hinsichtlich des gleitenden Merk- 
mals des Rundungsgrads der Vorderzungenvokale. Die Proben (Symbole) sind be- 
züglich ihres Referenzstamms gruppiert (y-Achse) und der vertikale Strich markiert 
den Median (! der Gruppe. Die Zahl und die gestrichelte Linie zeigt den Median der 
Gruppenmediane — das ist der Merkmalswert ( in den Abbildungen des Hauptteils. 
‚W1‘ weist mittels Symbol aus, welcher Binärklassifikator die höchste Wahrschein- 
lichkeit hat. 
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Abbildung 143: Merkmalsdistanz AC zwischen den langen und kurzen O- 
Lauten (0:, 0) als Referenz und hochdeutschen [5 o:]-Lauten als Vergleich (Symbol: 
Merkmalswert ( der Referenz; vertikaler Strich und Zahl: Differenz AC bezüglich des 
gleitenden Merkmals der Öffnungsstufe der Hinterzungenvokale; anderes Ende des 
Strichs, ‚—: ( des Vergleichs). Referenz- und Vergleichslaut gelten als unterschied- 
lich, falls die originäre Distanz AC® signifikant ist (**: hoch signifikant; x: signifikant; 
‚ls‘: zu geringe Probenzahl; ‚th‘: Minimaldistanz nicht erreicht:,ns‘: nicht signifikant). 
Während sich alle dialektalen, langen O-Laute (Or) signifikant sich vom hochdeut- 
schen [5] unterscheiden (oben links), ist dies für kurze O-Laute (0) im Vergleich zum 
hochdeutschen [5] nicht immer der Fall (unten links). 
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Abbildung 144 
nicht signifikant. 
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Abbildung 145 
Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


481 


Distanzen zum Hochdeutschen: Öffnungsstufe Dehnungs-A 


un 
nn 
ze ee 
SS 2 
I 
= 
3 
no 
© 
un 
oo a 
2% 
B Ss B 
Ss eb) Ss 
gi.e2s Fi gi.e2s 
aBmdo+x &0 fan sMdo+x 
Pe) 
B—— so -1eva8ı3 — KA FIevgeiy 2 x 20 + Tevaeıg m—— HH HF evaeıa 
B——— :ı -ıvgeus u KA) FIıvgeig Far a < 00 FIVgeg m———— 0 Ve 
00 + Irgeıd ——— 0 I 9 H o > F Ivdeng F Irdeug 
4— so I 134 — 4 1eged ©  Tedeug 4 1Egeu4 
H 20 + Tedeıg —— I Tea ° = ®  Tzdeıg 4 12484 
Du a ee) m—-—-#: / ır3a3 x s S F Irgeig F Irgeig 
00 Fr OITei HI 07 F 0183 > . Fi am r 9184 or r oe 
FH I [rt caH FREE: o| ‚© ot+r an| 9027 0 MH 
00 + Word m + Won < 5 5 E Fr awoni | —— 0 | won 
kr 00 + UNEOM Ss m FO 60 n E, © c 00 + UNEOM c 0 + UWeoy 
‚S co Ba | u — (0 6:70) ) ‘ ‘5 N r 39299 N r 39294 
Koi 00 + 3ar94 o 02 Fo 3a = . = 27} Oo r 38194 Oo r 38194 
c 00 F UNZOM c I 0 FO wu en 23 [e} 00 F UNZOM [e} I 07 + uw 
f sk zul +50 F zen je} = <e. £&E Kot zu E m I 9° 
pe or tb 104 0 "109 S zu TE Kot 19m | +5 PD 1 
< sort ae T I ——H r ame De ST QD ö < Kot aus | T I ———— 1 + Oo a4 
1 T 1 T 1 EB) ..N 1 T 1 1 Ri T 
= = = a o = PR) = a o = = a 
c 
B—— :0 -evaeıa PX ©0 Fr Ievgeiy & nn 3 ® x 20 - Tevdeig Mm—H:0 -1evaeıa 
B—— |: Fiivaeıa HH eo FIVderd ° x 00 + IWVdeld M—H 01 Frvaeıs 
00 + Irdelg = Dr zZ 2 F Irgeıg 
+ so F Te mo en  Tegeug 
80 + Tegeig ze} .- 2 r Tegeıy 
En Finde | 3 F Irdeug 
00 F oleıs sg .oO © mo L 04 | 
[oo dH ©..o. 0 E& Te)! 
yon «do 3 : ynor ; 
© Pic} N DO ke) 
T UnooN | — n fa ame une | 
‚S, vo. aan Dog oo ı EC 
3 De BEE ICN Ener eo lo sum | © 
= oo rw | NP + sS| © un. | © 
f BD —— : tr | ı N 90 S 2 = zoy = 
> —— 0: - 194 SE [>] >; 
< Bo! | T <« a < or | CT 
1 1 { je Ed en ' { { 1 { 1 
&) = P - a oe. Do - a o = : - a o = 
2 oo S 5 2 
BSy a} .ı- 
- nn ? 
—i 
den 
1 
[e>} 
— 
, 
— 
>. 
= 6 = 
en a. 
< >». So 


|] (Erläu- 


v 
4 


langen A und hd. [a a: > o 


terung vgl. Abb. 143, $. 479). Junges langes A unterscheidet sich nicht vom den hd. 


[aa 


Jungen 


AG zwischen dem j 


] (oben). 


v 
4 


Abbildung 147 
Keil: Der Vokaljäger (frankfurterisch.org; vokaljaeger.org). CC-BY Fassung (2022). Urspr.: Deutsche Dialektgeographie Bd. 122 


482 Zusätzliche Messergebnisse 


Distanzen zum Hochdeutschen: Öffnungsstufe kurzes dunkles A 


Signifikanz 


A: 
Ols 

+ns 
xith 


‚. kdA - hd. [a] .| kdA - hd. [a:] 
24 2- 
1 | | 
4-% {ki Ik T * 
EEE ET h oh ddade 
SERSSE 2858 ö SS 33523 
LK wwi&o& u GE 14 422383 
oa SyuuSS 05a» SS NPFı< 
vagd558dtoesesesns SSorsessee 
LEE ILEER EN [ers 
ı. kdA - hd. [0] 4. kdA - hd. [o:] 
2- T 2 x 
3-7% %43 - | | 
St | Al T ® E 
SE Hk S 2 E 
? 
h ae 03 
4- ri 6 E= = |4- Ki E= = 
& ade es Te|* eo ade eh 2 7 
2 2262 2$ ? Fr SETE 38 En 
Luu®mı 222238 Cuwwae Sao 28 
S..zaasz SriPiiz: 93.„gaaS3 SrÄPRESZ 
RB SAHU SZ FL BEE EB SUBOSSOSS 5 OD IST SSH 
KELEESL EEE ETEEEE IE GE EEE E LEER EEE KLE 


Abbildung 148: Al zwischen dem kurzen dunklen A (kdA) und hd. [a a: 5 or] 
(Erläuterung vgl. Abb. 143, S. 479). Es ist kein wesentlicher Unterschied festzustellen. 
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Abbildung 149: Al zwischen dem Monophthongierungs-A in Normalpositi- 
on und vor Nasal (MA und MA-N) und had. [a: >] (Erläuterung vgl. Abb. 143, S. 479). 
Monophthongierungs-A (MA) und hochdeutsches [a:] fallen zusammen. Monophthon- 


gierungs-A vor Nasal (MA-N) liegt tendenziell im Bereich des 
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Akronyme 


Aufgeführt sind Abkürzungen sowie mathematisch-technische Symbole und ihre Defini- 
tionen, die Kontrastgruppen des VOKALJÄGERS als auch die maßgeblichen Quellensiglen. 
Die Seitenzahl bezieht sich auf die Definition bzw. das erste Auftreten. 


[.| (Laut; phonetischer Lautwert), 18 

/./ (Phonem, phonemischer Lautwert), 18 
(.) (Graphem; exakte Reproduktion eines 
Schriftzeichen), 268 

» (Beginn eines Wörterbucheintrags), 271 

© (Markierung für Ortsvariante), 271 

(Markierung für Umlautvarianten), 271 

(Markierung für andere Variante), 271 
(belegte IPA- Aussprache), 271 
(Umlautform), 271 

„ (unteres Perzentilmittel), 86 

@. (oberes Perzentilmittel), 87 

QB (Perzentilbreite), 89 

Qu (Perzentilmitte), 90 

[X »Y] (symbolische Bezeichnung für das 
Kontrastpaar aus der Kontrastgruppe X 
und der Kontrastgruppe Y), 182 

pi(z) (Wahrscheinlichkeit, dass Elemen- 
tarausprägung i vorliegt), 171 

x (Datensatz akustischer Größen im Merk- 
malswert C), 171 

G (Merkmalswert Zeta; Definition), 183 

C° (initialer Merkmalswert), 171 

c! (Mittelpunktswert der Merkmalswerte 
pro Wortstamm), 182 

A( (Distanz zwischen den Zentren (ı und 
(a zweier Kontrastgruppen bzw. innerhalb 
eines Kontrastpaars), siehe AC Merkmals- 
distanz 

AG = a** [b-e] Notation einer Merkmals- 
distanz AC bzw. AC’: Der Median ist a, 
das 25%-Perzentil ist b, 50%-Perzentil ist 


c und »-Sterne zeigen die Signifikanz an. 
Im Falle eines geklammertem Wertes (a) 
ist dieser nicht signifikant von Null ver- 
schieden, also AC = 0 im Endergebnis, 
191 
AC° (originäre Merkmalsdistanz vor dem 
Ausblenden nicht signifikanter Werte), 
187 
* (im Zusammenhang mit Dialektalitäts- 
beurteilung im Kontrastpaar: Die Merk- 
malsdistanz ist binär dialektal), 187 
d (numerische Dialektalität), 188 
** (AG hoch signifikant, p < 0,01), 190 
* (AG signifikant, p < 0,05), 190 
ns (AG nicht signifikant, p > 0,05), 190 
th (‚threshold‘: mit Ad < 0,25 eine zu ge- 
ringe Merkmalsdistanz), 190 
ls (‚low samples‘: zu niedrige Probenzahl), 
190 


M-6 (Binärmerkmal mit dem Stützlaut [e]), 
197 

A (Kontrastgruppe der kurzen neutralen 
A), 300 

Ar (Kontrastgruppe der Dehnungs-A:), 324 

A-1t (Kontrastgruppe der A vor -LT), 379 

Ar-mod (Kontrastgruppe der jungen langen 
A), 331 

M-aa (Binärmerkmal mit dem Stützlaut 
[a:]), 197 

AP (Apparent-Time), 259 


B1, B2, B3 (Werte der Bandbreiten des ers- 
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ten, zweiten und dritten Formanten), 45 
BAT (Belegsigle). Battenberg 1880, „Ge- 
dicht“, 264 
BE (Sigle: Berliner Sätze des Kiel-Korpus), 
113 
Bo (Belegsigle). Born 1938, Die Mundart 
in Darmstadt und seinem Umland, 264 
Bon (Belegsigle). Bohn, Franz, 266 
BREI (Belegsigle). Breimund, Balser, 266 
Bro (Belegsigle). Broxten 1985, „Stadt- 
sprache — Stadtmundart -— Studie zum 
Gebrauch und zur Funktion mundart- 
naher Sprachvarietäten in Frankfurt am 
Main“ (hier: phonetische Transkripte zum 
Frankfurter Stadtdialekt um 1980), 258 


COS (Coefficient of Separation: Bhat- 
tacharyya-Distanz), 191 


DO, D1, D2 (nulltes, erstes und zweites For- 
mantdelta nach Syrdal, jeweils Abstand 
von F1 und FO, F2 und Fl, usw.), 81 

DA und DA-M (Kontrastgruppe der Mono- 
phthongierungs-A, gegebenenfalls vor Na- 
sal), 365 

Dim. (Beleg ist Diminutiv), 271 

Discrete-Cosine-Transformation 
57 


(DCT), 


E und Er (Kontrastgruppe der Wörter 
mit hochdeutscher [e]- oder [er]-Entspre- 
chung), 389 

M-E (Binärmerkmal mit dem Stützlaut [e]), 
197 

E2 (Wert des effektiven zweiten Formanten 
nach Fant; Normalisierung), 80 

M-ii (Binärmerkmal mit dem Stützlaut 
[e:]), 197 

ET (Belegsigle). Ettlinger, Karl, 266 


FO (Grundfrequenz), 72 

v-F12[3] (Prädiktorvariablensatz aus dem 
ersten, zweiten und gegebenenfalls dritten 
Formanten), 200 

F1, F2, F3, F4 (Werte des ersten, zweiten, 
dritten und vierten Formanten), 44 
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Fı (Belegsigle). Firmenich 1846a, Germa- 
niens Völkerstimmen, 248 

FR24 (Belegsigle). Freiling 1924, „Über die 
Mundart rund um Frankfurt“, 265 

FR25 (Belegsigle). Freiling 1925, „Über die 
Mundart von Oberrad“, 265 

FraFl, FraF2L, FraF3L, FraF4L, FraFJ1 
(Tonaufnahmen). Jüngere Frankfurter 
Sprecher aus dem REDE-Korpus; Haupt- 
periode 7, 277 

FraFA1L, FraFA2L (Tonaufnahmen). Älte- 
re Frankfurter Sprecher aus dem REDE- 
Korpus; Hauptperiode 6, 277 

FraLC (Tonaufnahme). Ältere Frankfurter 
Sprecherin; Hauptperiode 6, 277 

FraLD (Tonaufnahme). Frankfurter Laut- 
denkmal von 1937; Hauptperiode 5, 276 
FRrı (Belegsigle). Friedrich, Johann, 266 
Frs (Belegsigle). Fries, Johann, 266 

FWB (Frankfurter Wörterbuch), 254 


HAKE (Belegsigle). Hameran / Kehrein, 
266 

hd. (hochdeutsch), 30 

HEı (Belegsigle). Heister 1925, „Geschichte 
Bornheims“, 265 

HG1 (hochdeutsche Trainingsgruppe des 
Kiel-Korpus), 112 

HG2 (hochdeutsche Testgruppe des Kiel- 
Korpus), 112 


I und Ir (Kontrastgruppe der Wörter 
mit hochdeutscher [1]- oder [ir)-Entspre- 
chung), 389 

M-ii (Binärmerkmal mit dem Stützlaut 
[i:]), 197 

IPA (Vokalsystem der International Pho- 
netic Association), 20 


kdA (Kontrastgruppe der kurzen dunklen 
A), 345 

kFra. (klassisches Frankfurterisch), 238 

KG1, KG2 (Tonaufnahmen). Klein-Gerau- 
er Lautdenkmal; Hauptperiode 5, 276 
S-knn (Schätzermodell der K-Nearest 
Neighbors im VOKALJÄGER), 204 


AKRONYME 


KO (Sigle: Kohler Sätze des Kiel-Korpus), 
113 


LDA, S-Ida (Schätzermodell der Line- 
ar-Discriminant-Analysis im VOKALJÄ- 
GER), 200 

LP (Linear-Prediction), 443 


m{z} = x(o,5) (Median, P50, 50%-Perzen- 
til), 86 

MAD (median absolute deviation), 91 
MAB (Belegsigle). Malß 1833a, Die Ent- 
führung oder der alte Bürger-Capitain, 
242 

MDA, S-mda (Schätzermodell der Mix- 
ture-Discriminant-Analysis im VOKAL- 
JÄGER), 203 

MR (Sigle: Marburger Sätze des Kiel-Kor- 
pus), 113 

MSC (Ergänzungsgruppe), 112 


S-nb (Schätzermodell des Naive Bayes im 
VOKALJÄGER), 205 

nFra. (Neu-Frankfurterisch), 238 

NNET, S-nnet (Schätzermodell der neuro- 
nalen Netze im VOKALJÄGER), 203 

M-nRndFrnt (Binärmerkmal mit den Stütz- 
lauten [ir/er/e]), 197 


M-O (Binärmerkmal mit dem Stützlaut [>]), 
197 

0, 0:, 0-rC und O:-r (Kontrastgruppen der 
kurzen O, der langen O, der OÖ vor einem 
Konsonanten und der O vor intervokali- 
schem oder auslautendem R), 291 

Ö und Ör (Kontrastgruppe der Wörter 
mit hochdeutscher [ce]- oder [er]-Entspre- 
chung), 389 

M-oo (Binärmerkmal mit dem Stützlaut 
[o:]), 197 

OP (Belegsigle). Oppel 1839-1894, Faszi- 
kel. Beleg ist der Druckfassung des FWB 
entnommen, 242 

OPF (Belegsigle). Oppel 1839-1894: Fas- 
zikel. Beleg entstammt dem originalen, 
handschriftlichen Faszikel, 242 
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OPZ (Belegsigle). Oppel 1839-1894: Faszi- 
kel. Beleg ist der von Rauh verzettelten, 
handschriftlichen Form entnommen (aus 
der Materialsammlungen des FWB), 253 


P25, P50, P75 (Quartile; 25%-Perzentil, 
50%-Perzentil bzw. Median, 75%-Perzen- 
til), siehe 

Pl. (Beleg ist im Plural), 271 


QDA, S-qda (Schätzermodell der Quadra- 
tic-Discriminant-Analysis im VOKALJÄ- 
GER), 202 


RAU (Belegsigle). Rauh 1921a, „Die Laut- 
lehre der Frankfurter Mundart“, 253 
RAUFB (Belegsigle). Rauh/Bodensohn 
1939-1945, Materialsammlung Frankfur- 
ter Wörterbuch (hier: Rauhs Fragebögen 
zum Frankfurter Stadtdialekt), 253 
RAUK (Belegsigle). Rauh 1921b, „Die 
Frankfurter Mundart in ihren Grundzü- 
gen dargestellt“, 253 

RAUZ  (Belegsigle). Rauh/Bodensohn 
1939-1945, Materialsammlung Frankfur- 
ter Wörterbuch, 254 

RDA, S-rda (Schätzermodell der Regulari- 
zed-Discriminant-Analysis im VOKALJÄ- 
GER), 203 

M-RndFrnt (Binärmerkmal mit den Stütz- 
lauten [y:/o:/ce]), 197 


S-rf (Schätzermodell des Random Forest 
im VOKALJÄGER), 205 

ScHn (Belegsigle). Schnellbacher 1963, 
„Mundart und Landschaft des östlichen 
Taunus“, 266 

VA (Belegsigle). Valentin 1934, 
Geschichtlich-geographische Untersu- 
chungen zu den Mundarten rings um 
Mainz, 266 

ScHNA (Belegsigle). Schnapper, Heinrich, 
266 

Sing. (Beleg ist im Singular), 271 

STL (Belegsigle). Stoltze/Schalck 1860- 
1893, Frankfurter Latern, 240 
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S-svmRadial (Schätzermodell der radia- 
len Support-Vector-Machine im VOKAL- 
JÄGER), 204 


TEP (Belegsigle). Textor 1887, Frankfurt 
wie es leibt und lebt, 240 


Ü und Ür (Kontrastgruppe der Wörter 
mit hochdeutscher [v]- oder [y:]-Entspre- 
chung), 389 

M-uu (Binärmerkmal mit dem Stützlaut 
[u:]), 197 


V-X (allgemein: Prädiktorvariablensatz aus 
der bzw. den akustischen Größen ‚X‘), 200 
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WS (Belegsigle). Wenker 1888-1923, Der 
Sprachatlas des Deutschen Reichs (origi- 
nale Wenkerbögen zu Frankfurt und Um- 
gebung), 249 

WÜF (Belegsigle). Wülcker 1877, „Lautei- 
gentuemlichkeiten des Frankfurter Stadt- 
dialects im Mittelalter“ (hier: Belege zum 
Frankfurter Stadtdialekt um 1877), 249 

WüM (Belegsigle). Wülcker 1877, „Lautei- 
gentuemlichkeiten des Frankfurter Stadt- 
dialects im Mittelalter“ (hier: Belege zum 
Frankfurter Stadtdialekt des Mittelal- 
ters), 249 


Belegverzeichnis 


Dieser Index führt als kleines historisches Aussprachewörterbuch des Frankfurterischen 
alle im Rahmen dieser Arbeit herangezogenen Belege sowie Beispiele auf und verweist auf 
die entsprechenden Seiten im Text. Jedem Wort ist die normalisierte mittelhochdeutsche 
Form in Klammern nachgestellt. Der erschlossene bzw. in Rauh (1921a) dokumentier- 
te Lautstand des Frankfurterischen ist in IPA-Notation eckig geklammert angegeben. 
Zur Transkription vgl. Abschnitt 7.5.3 ab S.268 und zur phonetisch-phonologischen Ge- 
samteinordnung vgl. Tabelle 58 auf S.412. Ein expliziter Bezug auf eine Hauptperiode 
des Frankfurter Stadtdialekts ist mit einer entsprechenden hochgestellten Ziffer notiert: 0 
(vor 1825), 1 (1825-1850), 2 (1850-1875), 3 (1875-1900), 4 (1900-1925), 5 (1925-1945), 6 
(1945-1975) und 7 (nach 1975). Ein Lautwandel ist mit einem > angezeigt, wobei dieser 
jeweils zwischen den bezifferten Perioden stattfand. Fehlt die Ziffer, handelt es sich um 
den Lautstand der Periode 4. Das dunkle A des Frankfurterischen hatte in Hauptperiode 
3 und davor den Lautwert von IPA-[>]. In Hauptperiode 4 ist der Lautwert A-lastiger, 
was mit dem phonetisch-phonologisch motivierten Lautzeichen [a] angezeigt ist. 


ähnlich (ähnlich); [ernlif], alt (alt), 376, 380, 406, 413; Bär (ber); [bare], 418 
416 [alt]? [ol]? + [arl/aıl]? Bach; [bax], 299 

+ [aıl]?, 378 backen (backen); [bago], 
Abend (äbent); [o:vnt]” älter (elter); [eld&], 414 299 
+ [armnt/arvnt]? + a:]”, an, heran (ane); [ä:]‘, 333 bald (balde), 376, 380, 
310 Anke (Genick) (anke); 406, 413; [balt]? - [b>:l]? 
aber (aber); [»v&]*?, 344 [ank]*, 413 + [ba:l]?, 378 
Achse (ahse); [aks? Äpfel; [ebl], 415 Ball, 378 
+ [oks]? —[aks]* -[aks)’, Apfel (apfel); [abl], 299 Band (bant); [bant], 413 
342 arg (arc); [oJ]? — [af]*, 343  Bändel (bendel); [benl], 414 
Achsel (ahsel); [>ksl?? Arm (arm); [om]? Bank (banc); [bayk]?, 413 
+ [aksl]* — [aksl]°, 341 — [aım]*, 323 Bart (bart); [bo:t]? 
acht (ahte); [xt]? Ärmel (ermel); [ereml], 415 - [baıt]?, 343 
+ [axt]* - [axt]?, 341 Arsch (ars), 330; [a:f]®*, Baum (boum), 358; [barm]? 


Äcker; [eg&], 415 

Acker (acker); [ag&], 299 
Adler (adelar); [odl&]?” 
+ [a:dle]*, 344 

Adolf; [a:]?, 330 

Affe (affe); [af], 299 

allein (alein); [ola:], 364 
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330 
auch (ouch), 352, 361, 369; 
[ax]?  [arx]t, 362 
Auge (ouge), 352, 361; [a:x] 
+ [ax], 362 
Axt (ackes); 
+ [aks]*, 342 


[aks]? 


— [barm]*, 362 
Bäume (böume), 
[be:m], 425 
Beil (bihel), 360; [baıl], 422 
Bein (bein), 353, 354, 359, 
360; [bar], 364 
Bengel (bengel); [beyl|, 414 


358; 
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Berg _(berc); 
> [bee ]?, 418 

besser (bezzer); [bez&], 414 

betrachten (betrahten); 
[botroxto]? — [batraxdo]* 
— [botraxdo]°, 341 

Bett (bette); [bet]? — [bet]? 
[bet], 414 

biegen (biegen); [birzo], 424 

Birne (bir); [bire], 417 

Birnen (birn); [been], 416 


[baere ]* 


blähen (blejen); [ple:jo], 
421 
blasen (bläsen), 321; 


[ploıza]? - [pla:zo]*, 310 

Blatt (blat), 339, 406, 414; 
[plort]' = [plot]? = [plat]!, 
343 

blau (bla), 310, 406; [plo:] 
+ [plau]?, 312 

bläuen (blewen); [ple:jo], 
421 

blöd (blede); [ple:t], 388 
Blume (bluome); [plum], 
425 

Böcke (böcke); [bek], 388 
Bogen (bogen); [bo:yo], 289 

bohren (boren); [boren], 
290 

böse (bese); [be:s], 388 
Braten (bräte); [pro:do]? 
— [pra:da]*, 310 

brauchen (brüchen), 360; 
[pravyo]? - [pra:ryo]?, 364 
Bremse (breme); |prems], 
417 

bringen (bringen); 
[preno]?? — [prino]*, 416 
Brot (bröt); [pro:t], 289 
Brücke (brücke); [prik], 387 
Bruder (bruoder); 
[pru:d&], 425 

brüllen (brüellen); [prrilo], 
389 

Buch (buoch); [bux], 425 
Bürger (bürgeere); [baerej&], 
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421 
Bürste (bürste); [baeeft], 
420 
Butter (butter); [bud&], 
419 


da (dä); [do:]? > [da:]*, 311 

Dachs (dahs); [doks]? 
— [daks]?, 341 

der (der); [daere], 418 

dir (dir); [dire], 417 

Dorf (dorf), 288; [doef], 290 

Dörfer; [deey&], 419 

Draht  (drät);  [tro:t]? 
+ [tra:t]*, 311 

Dreck (drec); [trek], 417 
drücken (drücken); [trigo], 
387 

du (du); [du:], 420 

dürfen (dürfen), [daevo], 
420 

Durst _ (durst); 
- [daft], 420 


[doeft] 


eher (eher); [are], 415 
Eier (eiger); [a:j&]*, 361 
ein (einez), 352, 354, 359 
eins (einez); [a:nds], 364 
Eisen (isen), 360; 
laızo/a:z&n]*, 364 

erst (erste); [aeft], 423 
Erz (erz); [eets], 415 

Esel (esel); [e:zl], 415 
essen (&zzen); [ezo], 417 


Fäden; [fedm], 415 


Faden (vadem,  vaden); 
dm]? + Fadn]*, 344 
Fahne (fane); [fon]? 


+ [fa:n]*, 322 

fahren (varn); [*a:]! + [21], 
322 

fährt (vert); [faeret], 415 
Fahrt (vart), 339; [fort]?, 
343 

fallen (vallen); [falo], 299 


Farbe (farwe), 339; [fop]?” 
+ [fap]* - [fap]?, 343 
Fass (vaz), 298; [fas], 299 
Feier (feier); [faj&], 422 
feimen (feimen); |[farmo]?, 
362 

fest (veste); [fest], 414 
feucht (viuchte); [foıft], 424 
Feuer (viur); [foj&], 424 
Fisch (visch); [fif], 416 
Flachs (vlahs); [floks]?, 342 


Flasche (vlasche); [flaf], 
299 
Fleisch  (vleisch), 352; 


af]? > Has]! = ac), 
361 
fliegen (fliegen); 
+ [flir3o]?, 424 
Floh (vlöch); [flo], 290 
fort (vort), 288; [foet]* 
- [fat], 290 
fragen  (vrägen), 
[froryo]?, 311 
Frankfurt (Frankenvord); 
[frayfoet]*, 413 

Frau (vrouwe), 369; [fra:]? 
+ [fra:]*, 363 


[fli:jo] 


406; 


Freude, freuen (vröude, 
vröuwen), 357, 369, 401, 
406; [rat]? — [fratt, 


fraro]? - [froit, frojo]*, 
364 

Fuß (fuwos); [fu:s], 425 
Füße (füeze); [firs], 388 
Fuchs (vuhs); [fuks], 419 
füttern (vüettern); [fid&n], 
389 


Gabel (gabel); [ovl]? 
+ [gJavl]* + [gavl]?, 343 
Gans (gans); [Yands]? 


— [dands]*, 413 
gar (gar); [921]?  [ga:]‘, 
323 


garn (garn); 
+ [Jamm]*, 323 


[g9:n]? 


Garten (garten), 339, 
406; [92:do]” — [dardo]” 
+ [dads]* — [dada]?, 342 

Gärtner; [gaeredn&]* 
+ [(Jeedn&]?, 415 

Gasse (gaz33e); [gas], 300 

Gäste (geste); [gest], 414 


geboren (geboren); 
[öoboren], 290 

gebracht (gepräht); 
[gopraxt|* - [gopraxt]°, 
341 

gedacht (gedäht), 338; 
[godoxt]? + [odaxt]* 


+ [dodaxt]?, 271; [godoxt]? 
> (godaxt]! — [dadaxt]?, 


341 

gefunden (gefunden); 
[9sfuns], 420 

gehabt (gehät), 340; 


[gohot]? — [gehabt/gohat/ 
gahot]*, 344 
gelb (gel); [ge:l], 418 
gemacht (gemaht); 
[gomaxt]??  — [gomaxt]* 
+ [omaxt]”, 341 
Gerte (gerte); 
2 [gaet]?, 415 
gesagt (gesaget), 338; [>] 
+ [ksaxt]* — [ksaxt]?, 341 
gestorben; [kfdarevo], 290 
getan (getän); [godar]*, 312 
geworfen (geworfen); 
[gavseyo], 290 
Glas (glas), 321; [kloıs]? 
+ [kla:s]?, 323 
glatt (glat), 406; 
[klst/klat]? = [klat]*, 343 
glauben (gelouben); [kla:vo] 
+ [kla:vo]*, 363 
Gräber; [kre:v&], 416 


[gaeret]* 


Grab (grap);  [kro:p]? 
+ [kra:p]?, 323 

Gräber, 359 

Gras (gras); [kro:s]? 


+ [kraıs]*, 323 
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grau (grä), 310, 406; [kro:], 
312 

groß (grö3); [kro:s], 289 
größer (grezer); [kre:z&], 
388 
Gurgel (gurgel); [go:il], 420 
Gürtel (gürtel); [gaeedl], 
420 

gut (guot); [Qu:t], 425 


Hüh, 385 

Haar (här); [ho:]?  [ha:]f, 
311 

habe (hab), 406; [hop]? 

— [hap]*, 345 

haben (haben); [hovo]?? 

+ [hava]* - [havo]?, 345 

habt (habt); [9]?, 345 
Hafer (habere); [hov&#]? 

+ [havi]*, 344 

Hahn (han); [:]?, 323 

halten (halte); [haldo], 378 

hältst (heldest); [heldst], 
414 

Hammel (hamel); [ha:ml]?, 
344 
Hammer 
[harm&] 
+ [ham&]?, 344 
Hand (hant); 
+ [hant]*, 413 
Handel (handel); [hanl]*, 
413 

hart (hart); [hot]? — [hat]*, 
342 

Hase (hase), 321, 
[ha:s]?? — [ha:s]*, 322 
Hass (haz), 361; [has], 299 
hast (häst), 340, 406; 
[hast/host]*, 344 

hat (hät), 340, 406; [hot]? 


(hamer), 
— [ham] 


340; 


2,3 4 


[hant]? 


361; 


> [hat/hot]”* [hat], 
344 
hauen (houwen), 356; 


[haryo]? — [haryo]*, 363 
Haus (hüs); [havs], 423 
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Häuser; [hoız&], 424 

haut; [he:ft], 425 

heben (heben); [he:vo], 415 

heiß (heiz), 361; [ha:s]? 
— [ha:s]*, 361 

heißen (heizen), 352, 358; 
[ha:zo]? > [ha:zo]?, 361 


heilen (heilen); [ha:lo]? 
— [ha:lo]*, 361 
Heim (heim); [ham]? 


— [ham], 362 
Herz (herz); [haeets], 417 
heute (hiute); [hort], 424 
hin (hin); [hir], 417 
Hirsch (hirsch); [haef], 416 
Hitze (hitze); [hits], 416 
hoch (höch); [ho:x], 290 
hohl (hol); [ho:l], 289 
Höhle (<hölern); [he:l], 388 
holen (hole); [ho:lo], 289 
Holz (holz); [holds], 289 
horchen (hörchen); [hoe30], 
290 
Hose (hose), 288; [ho:s], 289 
Hügel (hügel); [hi:z]], 388 
Hütte (hütte); [hit], 387 
jämmerlich  (jemerlich); 
Ljemslif], 422 
Jagd (jaget); [jaxt]*, 341 
jagen (jagen); [joryo]?, 322 
Jahr (ar); [o? Leit, 
311 


Kabel (kabel); [>]°, 343 
Kalb (kalp); [kalp/k"alp], 
300 

Kälber (kelber); [k"elv&], 
414 

kalt (kalt), 380, 
406, 413; [kPalt]? 
+ [kKBarl/kBarl]? + [kanl]?, 
378 


376, 


Kamm (kamp); [kam]? 
+ [ktam]?, 413 
Kammer (kamer); 
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+ [kPama&]t, 


[kam]? 
413 

Karte (karte), 339; [k"o:t]? 
+ [kart]? + [kat]? 
+ [kPat]?, 342 

Käse (kese); [k"e:s], 421 
Kasten (kasten); [kasto], 
300 

Katze (katze); [k"ats], 300 
kaufen (koufen); [kPa:yo]? 
+ [kParvo]*, 363 
käufst; [kPerfst], 425 
kehren (keren); [k"aren], 
423 
Keil (kil); [kaıl], 422 

kein (kein), 352, 354, 359; 
[khär], 364 

Kern (kerne); [ken], 417 
Kirche (kirche); [k"zeef], 
416 
Klammer 
[klam&]?® 
413 

Klee (kl&); [kle:], 422 

Kleid  (kleit);  [kla:t]? 
+ [kla:t]*, 362 

klein (klein); [klä:], 364 

klopfen (klopfen); [klobe], 
289 

Knöchel (knöchel); [knezl], 
388 

Kohl (kele); [k"e:l], 388 

Kopf (kopf); [k"op/kop"], 
289 

Korn (korn); [k"oen], 290 

Kraft (kraft); [kraft], 300 

Kranz (krants); [krants], 
413 

Kränze; [krends], 415 

Kuchen (kuochen); [k"uyo], 
425 

kurz (kurz); 
> [k"ats]?, 420 


(klamer); 


> [klamöe]*, 


[kPoets]* 


lachen (lachen), 339; [layo], 
299 
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Läden, 359 

lassen (lägen); 
+ [laza/lozo]*, 345 
laufen  (loufen); 
- [la:va]*, 363 
läuft; [leıft], 425 
laut (lät); [laut], 423 
Leder (leder); [led&], 417 
Lehne (len); [lern], 418 
Lehrer (lerer); [lae:r&], 423 
Leim (lim), 360; [lamm]? 
— [larm]*, 364 

lesen (lesen); [le:zo], 418 
Leute (liute); [lort], 424 
Loch (loch); [lox], 289 
Löcher (löcher); [lez&], 388 


1020]? 


[la:vo]? 


machen (machen); [mayo], 
299 

Macht (maht); [maxt]?, 341 
Magen (mage); [maryo]? 
— [maryo]*, 322 

Main (Moinus), 354, 360; 


[mar], 364 

mal (mäl), 310; [ma:l]? 
— [marl/mol:]*, 312 
malen (mälen); [mar]? 
+ [marlo]*, 311 

Mann (man); [man]? 


— [man]*, 414 
Maul (mül); [mavl], 423 


meinen (meinen); [me:no] 
— [marma]*, 364 


2 


Meister (meister), 352; 
[ma:sd&]?  — [marsd&]?, 
362 


Mensch (mensche); [mend/, 
menzo], 414 

morgen (morgen), 
[marejo/mo:int], 290 

Mühe (müeje); [mir], 389 


288; 


Müller (müller); [mil&], 
387 

nämlich (nämlich); 
[nermlif]? > [neımlif]‘, 
416 


nach (näch),; [no:x]? 
+ [narx]*, 311 

Nacht (naht), 338; 
[na:xt]? — [naxt]* 
— [naxt]?, 341 

Nadel (nädel); _[na:dl]? 
+ [na:dl]*, 311 

nagen (nagen); [naryo]? 
> [na:yo]*, 322 

nähen (nejen); [ne:jo]* 
> [nerjo]?, 421 

Naht (nät); [na:t]*, 311 

Nase (nase), 321; [na:s]? 
+ [na:s]*, 322 


nass (naz); |nas], 299 
Nazi, 330, 401, 406 
Nebel (nebel); [nevl], 417 
Nest (n@st); [nest], 417 
noch (noch); [nox], 289 
Not (nöt); [no:t], 290 


Ofen (oven); [o:vo], 289 
Ohr (öre); [ore], 290 
Öl (6); [ei], 388 


paar (pär); [5:]?, 311 

Pfeffer (pfäffer); [p"evä), 
417 

Pflanze 
[plands]?, 413 

Pflänzi; [plenzi:], 415 

Pfund (pfund); [p"unt], 420 


(pflanze); 


plagen (plägen); [1]? 
+ [plargo]*, 311 

plärren (bleren); [plaro], 
423 

platt (plat), 406; 


[plot/plat]? - [plat]?, 343 
Pracht (praht); [praxt]”, 
34l 


Puppe (puppe); [bop], 420 


räumen (rümen); [Raums]? 
— [raımo]*, 365 

Rad (rat); [rsıt]?  [Ra:t]%, 
323 


Räder (reder); 
+ [rerd£]*, 415 
Rahm (roum); [ra:m]?, 363 
Rahmen (rame); [ro:m]?, 
322 

rasch (rasch); [raf], 300 
Rauch (rouch); [ra:x]? 
+ [ra:x]* + [ra:x]?, 363 
Raum (rüm); [raum], 423 
räumen (rümen), 360 


[red]? 


Raupe (rüpe); [raup]? 
+ [ra:p]*, 365 
Regen (regen); [re:30] 


= [Re:30]°, 418 

Reh (rech); [rer], 422 
Rettich (retich); [redif], 
422 

Rohr (rör); [rore], 290 
Röhre (roere); [Rare], 423 
rot (röt); [ro:t], 290 

Rotz (rotz), 288; [rots], 289 
Rübe (rüebe); [ri:vo], 389 
Rücken (rücken); [rigo], 
387 

rupfen (rupfen); [robo], 420 


Saal (sal); [so:1]?, 323 

Sack (sac); [sak], 299 

sagen (sagen); [sorxo]? 
+ [sarya]*, 322 

sagt; [Je:ft], 416 

Salz (salz), 376, 380, 413; 
[salds], 379 
satt (sat), 
+ [sat]*, 343 
saufen (süfen); [sauvo], 423 
Saum (soum); [sarm]?, 363 
Schachtel (schachtel), 338; 
[oxal], 341 


339; [st]? 


schaden (schaden); [>]? 
> [fada]*, 344 

Schaf  (schäf); [af]? 
+ [fa:f]*, 311 

scharf (scharf);  [jsf]? 


> [faf]*, 343 
scheel (schel); [fe:l], 418 
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scheinen (schinen); [fams>], 
422 

Schere (scheere); [[aere], 422 

schlachten (slahten); 
[floxto]? + [a], 341 

schlafen (släfen, släf); 
[flo:va]®? = [flasvo]*, 311 
Schläge (slege); [flef]* 
> [Jle:f]P, 415 

schlagen (slahen); [floryo]? 
+ [a:]?, 322 

Schlauch (slüch); [laux]? 
+ [fla:x]*, 365 

schlecht (sleht); [flexft], 418 
Schleim (slim); [laım], 422 
Schnabel (snabel), 298, 
340; [navi]? - [navi]? 
+ [fnavl]?, 343 

Schnee (sn); [ner], 422 
Schnupfen (snupfen); 
[Snubo], 420 

Schnur (snur); [fnure], 420 


schön (schene); [je]? 
+ [j&:]°, 388 

schüren (schüren); [er]? 
+ [firen]*, 388 

Schürze; [[aets], 420 

Schwan (swan); [fvom]? 
+ [fvaın]?, 323 

schwarz (zwarz), 339; 
[[vots]? + [[vats]* 
+ [[vats]?, 342 

Schwester (swester); 
[[vesd&], 417 

schwimmen (swimmen); 
[[vema]? — [[vims]*, 416 


Sehne (sen); [sen], 418 
Seife (seif), 369; [sa:f]? 
+ [sa:f]*, 362 

Senf (senf); [semf], 417 
Sense (segense); |sends], 
417 

singen (singen); [sigo], 416 
sorgen (sorgen); |[sorejo], 
290 

Span (spän); [ar], 312 


509 
Spansau, 308 
Sprache (spräche); 
[[pra:x]?° + [fpra:x]*, 
3ll 


spülen (spüelen); [bir], 
389 

Spur (spur); [fbure], 420 
spüren (spüren); |[[biren], 
388 

Stadt (stat); [*o]! - [dot]? 
> [[dat]*, 343 


Stamm (stam); [fdam]? 
= [Sdam]*, 414 
stark (starc);  [ftok]?” 


+ [ftak]* — [ftak]?, 343 
statt (stat); [0]?, 343 


Steg (stec); [Ste:f]? 
- [fterf]?, 418 
stehlen (stelen); [der], 


418 
Stein (stein), 352-354, 360; 
[dar], 364 
sterben 
[Sdaerevo], 418 
Stiel (stil); [fdi:l], 417 
hören (heeren); [haeren], 423 
stören (roere); [[daeren], 423 


(sterben); 


Strähne (stren); |ftrem], 
418 

Straße (sträze); [Jtra:s]? 
+ [ftra:s]*, 311 

Strafe (sträfe); [ftro:f]? 


+ [ftrasf]*, 311 

streichen (strichen), 360; 
[Jtra:30], 364 

Streu, streuen (ströuen); 
[ftraro]? — [ftra:, ftra:o]® 
+ [[tror, [trojo]*, 364 


Tafel  (tavel); 
> [(davyi]?, 322 
Tag (tac); [do:x]? > [da:x]!, 
323 

Tasche (tasche); [daf], 300 
täte (tete); [de:t], 421 
tauchen (tüchen), 360 


[d:yl]? 
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Taufe (toufe), 352 

teuer (tiure); [doj&], 424 

Teufel (tiwvel); [dal], 424 

tief (tief); [di:f], 424 

Tor (tor); [dore], 290 

Törchen; [daerezo], 419 

tot (töt); [dort], 290 

Tracht (traht); [troxt]? 
+ [traxt]* + [traxt]?, 341 

tragen (tragen); [troryo]? 
+ [trarya]*, 322 

Träger; [tre:3&], 416 

Traum (troum); [tram]?, 
363 

treiben (trüben); [trarvo], 
422 

tröpfeln 
[trebalo], 388 

tropfen (tropfen); [trobe], 
289 

trüb (truebe); [trip], 389 

Turm (turm); [t"oem], 420 


(tröpfeln); 


über (über); [iv], 387 


Vater (vater); [fd]? 
> [fad&]? - [fad&]?, 344 
verloren (verloren); 

[fsloren], 290 
vierte (vierte); [faret], 424 
Vögel (vögel); [fe:z]], 388 
Vogel (vogel); [foryl], 289 
vor (vor); [fore], 290 


Wachs 


(wahs); 52 


[vaks 
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+ [vaks]* — [vaks]?, 342 

wachsen (wahsen); 

[vokso]?? > [vaksa]* 

> [vaksa]?, 342 

Wacht (waht); [voxt]? 

+ [vaxt]* — [vaxt]?, 341 

Wahl (wal); [vo:l]?, 323 

wahr (wär); [var]? > [var]*, 
311 

Wald (walt), 376; [valt], 379 

war (was), 298 

wäre (weere); [vaere], 422 

Ware (ware), 298; [5:]?, 322 

warm (warm); [vorm]? 

— [varm]*, 323 

Warte (warte), 414 

warten (warten); [vo:do]? 

> [va:do]* > [vado] 

> [vada]?, 342 

Wärter; [vaered&] 

+ [vaeed&]’, 415 

was (waz); [vos]? 
345 

waschen, Wäsche; 
> [ve39, vef], 415 

Wasser (waszer); 
300 

Weg (wöc); verf]! = [vexf]®, 
418 

weiß (wiz), 369 

weiß < wissen (weiz), 352, 
356; [va:s]?, 362 

Weide (weide), 360 

Weide (wide), 360 


rs 


+ [vas]*, 


[*ef 


[vaz&], 


Weiher (wiher); [vaj&], 422 


Wein (win); [vaı]?* 
+ [var]?, 364; [var], 422 
werden (werden); 


[v@en/varen], 417 
werfen (werfen); [vaeyvo], 
417 
wie (wie); [vi:], 424 
wir (wir); [mire], 417 
wird (wirdet); [vaeet], 416 
wirft (wirft); [vaeeft], 416 
Wirt (wirt); [vaeet], 416 
wollen (wollen); [volo], 289 
worden (worden); [voren], 
290 
Wort (wort); [voet], 290 
Wörter; [vared&], 419 
wühlen (wüelen); [virlo], 
389 
würgen (würgen); [vaerej&], 
421 
Wurm (wurm); [voem], 420 
Wurst (wurst), 288; [voeft]* 
+ [vaft]°, 420 


Zahn (zan); [tsä:]*, 323 


Zähne (zene); [tse:/tse:], 
415 
zart (zart); [tsort]? 


+ [tsat]?, 342 
zupfen (zupfen); 
420 

zwei (zwei), 352; [tsva:] 
+ [tsva:]*, 362 


[tsobo], 


2 


Index 


Der Index verweist für ausgewählte Themen auf die entsprechenden Seiten im Text. 
Besonders relevante Seiten sind unterstrichen. 


(ä) (Graphem). Wirrung um Ä- 
Schreibungen, 352 

[a/a:] (neutrales A und Monophthongie- 
rungs-A), 23, 31-33, 157-159, 243, 268, 
297, 297-302, 351-371, 375-381, 398, 401, 
404, 409, 413-414 

[a/a:] ([>/>:]) (dunkles A), 24, 32, 157, 243, 
268, 307, 306-347, 361, 375-381, 400-401, 
403, 406-409, 414, 421 

[a:] (nasaliertes dunkles A), 308, 353, 410 
[a/a:] (palatisiertes helles A), 243, 268, 358, 
351-360, 371, 404, 409, 424, 425 

A (mhd. altkurzes A), 297, 297-302, 398, 
401, 413-414 

A-LT (mhd. altkurzes A vor -LT), 375-381, 
406, 413 

Ar (mhd. altkurzes A in Dehnung), 320, 
319-347, 400-401, 403, 406-408, 414 

A (mhd. altlanges A), 306, 306-316, 336- 
347, 400-401, 403, 406-408, 421 

alte Diphthonge, 267 

altkurze Vokale, 267 

altlange Vokale, 267 

Altlaute, 267 

Askenasy, Alexander, 244, 252 

Ausreißer, 107 


Bark (Normalisierung), 76 

Bhattacharyya-Distanz (COS), 191 

Binärklassifikator, 194 

Binärmerkmal, 170, 176; im VOKALJÄ- 
GER, 197 

Broxten, Eva Maria, 258 


CARET, classification and regression. trai- 
ning, 206 


D-Wert, 173 
AG Merkmalsdistanz; binäre Dialektalität, 
187; Definition, 181; Endgültige Merk- 
malsdistanz AG (Formel), 187; Notation 
und Signifikanz, 190; numerische Dialek- 
talität ©, 188; Originäre Merkmalsdistanz 
AC® (Formel), 187 
Dialektalität; Binäre Dialektalität, 187; 
numerische Dialektalität d, falls die er- 
wartete Merkmalsdifferenz AC = 0 ist 
(Formel), 189; numerische Dialektalität 
®, falls die erwartete Merkmalsdifferenz 
AG > 0 ist (Formel), 188 
Discrete-Cosine-Transformation 
56-64, 71, 105, 220 


(DET), 


Elementarausprägung, 170, 176 

Ensemble, 171; im VOKALJÄGER, 226 

Entrundung, 385, 385-392, 400, 403, 404, 
411, 419-421, 423, 425 

Extremdreieck, 94, 98, 105; Kalibrierung, 
119 


Fants effektiver zweiter Formant (E2; Nor- 
malisierung), 80 

Faszikel (Schreibhefte) Oppels, 242 
Firmenich, Johannes Matthias, 248 
Formantbahn, 53 

Formantbandbreite (B1-B3), 45, 104, 220 
Formantdiagramm, 47-51, 446 
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Formanten, 44, 42-109, 218; als Prädiktor- 
variablen, 200, 218; F1- und F2-Vertei- 
lungen für das Hochdeutsche, 130; Werte 
für das Hochdeutsche (normalisiert), 141- 
147, 150, 150-165; Werte für das Hoch- 
deutsche (original), 124-137 

Formanttetragon, 93 

Formantziel, 55 

Frankfurter Wörterbuch (FWB), 253, 254, 
254-258 

Frankfurterisch, 236 


Gerstman-Normalisierung, 81, 90 

Gleitendes Merkmal, 170; Öffnungsstufe, 
195; Rundung, 197 

Grenzfrequenz (obere), 104, 107, 117 

Grundfrequenz (FO), 72, 220 


Hauptperioden des Frankfurter Stadtdia- 
lekts, 259 
Hessisch/Zentralhessisch (hier insbesonde- 
re das Hessisch der Frankfurter Vororte 
und des Taunus), 234, 236, 238, 240, 249, 
253, 262, 288, 308, 313, 315, 321, 325, 338, 
339, 351, 354, 356, 357, 375, 376, 386, 387, 
400, 404, 406, 413, 416, 422-424 
Hochdeutsch, 30 


Institut für Stadtgeschichte (Frankfurt am 
Main), 236, 242, 253, 254, 278, 429 
Intensität, 72, 150 

Interquartilellipsen, 137 


K-Nearest Neighbors 
KMM, S-knn), 204, 216 

Kardinalvokale, 20-26, 42-51, 113, 154 

Kiel-Korpus, 112-113, 150, 162 

Klassifikation, 192 

Klassifikationsphonetik, 17, 169-230 

Klassifikator; finale Version im VOKALJÄ- 
GER, 226 

Kompromissfehler, 208 

Konsonanten (Frankfurterisch), 270 

Kontrastgruppe, 182 

Kontrastlaut, 177; im VOKALJÄGER, 197 


(Schätzermodell 


Lautdauer, 73, 150 
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Lautdenkmal, 89, 276, 292-294, 301-302, 
313-316, 324-327, 331-333, 347, 367-371 
380-381, 392, 398, 398-401, 404-408 

Linear-Discriminant-Analysis  (Schätzer- 
modell LDA, S-1da), 200, 216 

Lobanov-Z-Wert-Normalisierung, 82, 91 


MAD-Normalisierung, 91 

Malß, Carl, 240, 242, 248, 298, 352, 354, 
376, 423 

Median (P50, 50%-Perzentil), 86 
Merkmal, 170 

Merkmale, 27-29 

Messphonetik, 17, 35-166 
Mittelhochdeutsches Bezugssystem, 267 
Mittelwert, 82 
Mixture-Discriminant-Analysis (Schätzer- 
modell MDA, S-mda), 203, 216 


Naive Bayes (Schätzermodell NB, S-nb), 
205, 216 

Neuronal Network (Schätzermodell NNET, 
S-nnet), 203, 216 

Normtetragon, 94 

Numerische Dialektalität 9, 189 


[0/o:/»/»:/o:] (O-Laute), 24, 243, 288, 287- 
294, 398, 401, 406, 411, 418-420, 423 
o/o: (mhd. altkurz) und 6 (altlang), 289, 
287-294, 398, 401, 406, 418-419, 423 
Öffnungsstufe, 28, 195 

Oppel, Johannes, 238, 242, 242-248, 253- 
258, 268-271, 288, 297-298, 306-310, 319- 
322, 330, 337-341, 352-360, 376, 385-387, 
410 

Eı (mhd. Diphthong), 351, 351-371, 401, 
403, 404, 424 

ou/öu (mhd. Diphthonge), 351, 351-371, 
401, 403, 404, 424-425 


Perzentil, 86 

Perzentilbreite, 89 

Perzentilmitte, 90 

Perzentilmittel, 86 

PRAAT, 44, 64, 95, 103-104, 113, 117 
Prädiktorvariable, 194; im VOKALJÄGER, 
200 


INDEX 


Quadratic-Discriminant-Analysis (Schät- 


zermodell QDA, S-rda), 202, 216 


R Programming Language, 103-108, 206, 
213 

Rauh, Ludwig, 238, 248, 253, 253-258, 
268-271, 288, 294, 297-298, 306-310, 319- 
322, 337-341, 352-361, 376, 385-387, 410 
REDE (Projekt Regionalsprache.de), 226, 
229-230, 276-277, 292-294, 301-302, 313- 
316, 324-327, 331-333, 347, 367-371, 380- 
381, 392, 401, 401-404, 429 
Regularized-Discriminant-Analysis (Schät- 
zermodell RDA, S-rda), 203, 216 
Reliktwörter; alter Diphthong Iu, 423; alt- 
kurzes U, 419; altkurzes 1, 416; altlanges 
A, 310, 312, 340, 406 

Rückfaltung, 94, 95, 105, 107, 119 
Rückprojektion, 92 

Rundung, 197 


SAMPA, 20 

Schätzermodell, 194; im VOKALJÄGER, 
200 

Siglen (Belege), 264-271 

Signifikanz; Merkmalsdistanz, 190 
Stützlaut, 170 

Standardabweichung, 82 

Stoltze, Friedrich, 240, 352, 353, 359, 376, 
423 
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Stützlaut, 176; im VOKALJÄGER, 197 
Support-Vector-Machine (Schätzermodell 
SVM, S-svm- Radial), 204, 216 

Syrdals Formantdeltas (DO-D2; Normali- 
sierung), 81 


Teuthonista, 254, 268 
Training, 206 
Transkription, 268 


U im Kiel-Korpus, 150 


Vokale; Frankfurterisch, 245, 246, 269, 407, 
412, 284-425; Hochdeutsch, 30-33, 122, 
166, 229; IPA, 20-26 

Vokalnummern Oppels, 243 

Vororte, 236, 262, 387 


Wenkersätze, 249 
Wülcker, Ernst, 249, 268-271, 298, 307, 
337-341, 352-357, 376, 387 


Z (Einheit des Z-Werts), 82 
Zeta-Merkmalswert (, 170; Definition, 183; 
Initialer Merkmalswert £® (Formel), 171; 
Konzept, 170; Merkmalswert C! als Mit- 
telpunktswert pro Wortstamm (Formel), 
182; Messergebnisse Hochdeutsch, 229; 
Wahrscheinlichkeit p;(x) einer Elemen- 
tarausprägung, 171 
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